علی‌بابا مدل هوش مصنوعی تولید ویدئو و تصویر خود را به طور عمومی منتشر کرد

به گزارش رویترز، شرکت علی‌بابا، رهبر تجارت الکترونیک چین، روز چهارشنبه اعلام کرد که مدل هوش مصنوعی تولید ویدئو و تصویر خود، Wan 2.1، را به صورت عمومی و متن‌باز منتشر کرده است. این اقدام احتمالاً باعث افزایش استفاده از این مدل و تشدید رقابت در حوزه هوش مصنوعی خواهد شد.

این اقدام علی‌بابا پس از اقدام مشابه استارتاپ DeepSeek صورت می‌گیرد، که مدل‌های متن‌باز و به ظاهر ارزان قیمت آن، در اوایل سال جاری، با عملکردی مشابه رقبای مطرحی مانند OpenAI، هیجان زیادی در میان سرمایه‌گذاران فناوری و تعجب در این بخش سرمایه‌بر ایجاد کرد.

علی‌بابا اعلام کرد که چهار نوع از مدل Wan 2.1 را منتشر کرده است: T2V-1.3B، T2V-14B، I2V-14B-720P و I2V-14B-480P، که تصاویر و ویدئوها را از ورودی متن و تصویر تولید می‌کنند. “14B” نشان‌دهنده این است که این نوع مدل ۱۴ میلیارد پارامتر را می‌پذیرد، به این معنی که می‌تواند ورودی بسیار بیشتری را پردازش کند تا نتایج دقیق‌تری ارائه دهد.

این مدل‌ها به صورت جهانی در پلتفرم‌های ModelScope علی‌بابا کلود و HuggingFace برای استفاده‌های آکادمیک، تحقیقاتی و تجاری در دسترس هستند.

علی‌بابا آخرین نسخه مدل هوش مصنوعی تولید ویدئو و تصویر خود را در ماه ژانویه معرفی کرد، که بعداً نام آن را از Wanx به Wan کوتاه کرد، و توانایی آن را در تولید تصاویر بسیار واقع‌گرایانه برجسته کرد.

این شرکت از آن زمان به رتبه‌بندی برتر خود در VBench، یک جدول رتبه‌بندی برای مدل‌های تولید ویدئو، اشاره کرده است، جایی که در عملکردهایی مانند تعامل چند شیء پیشتاز است.

روز سه‌شنبه، علی‌بابا پیش‌نمایشی از مدل استدلال QwQ-Max را منتشر کرد که قصد دارد پس از انتشار کامل، آن را به صورت متن‌باز ارائه دهد.

همچنین این هفته اعلام کرد که قصد دارد حداقل ۳۸۰ میلیارد یوان (۵۲ میلیارد دلار) در سه سال آینده برای تقویت زیرساخت‌های رایانش ابری و هوش مصنوعی سرمایه‌گذاری کند.

اخبار تکنولوژی را در سایت خبری مجتمع نوآوری فرداد بخوانید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *