به گزارش رویترز، شرکت علیبابا، رهبر تجارت الکترونیک چین، روز چهارشنبه اعلام کرد که مدل هوش مصنوعی تولید ویدئو و تصویر خود، Wan 2.1، را به صورت عمومی و متنباز منتشر کرده است. این اقدام احتمالاً باعث افزایش استفاده از این مدل و تشدید رقابت در حوزه هوش مصنوعی خواهد شد.
این اقدام علیبابا پس از اقدام مشابه استارتاپ DeepSeek صورت میگیرد، که مدلهای متنباز و به ظاهر ارزان قیمت آن، در اوایل سال جاری، با عملکردی مشابه رقبای مطرحی مانند OpenAI، هیجان زیادی در میان سرمایهگذاران فناوری و تعجب در این بخش سرمایهبر ایجاد کرد.

علیبابا اعلام کرد که چهار نوع از مدل Wan 2.1 را منتشر کرده است: T2V-1.3B، T2V-14B، I2V-14B-720P و I2V-14B-480P، که تصاویر و ویدئوها را از ورودی متن و تصویر تولید میکنند. “14B” نشاندهنده این است که این نوع مدل ۱۴ میلیارد پارامتر را میپذیرد، به این معنی که میتواند ورودی بسیار بیشتری را پردازش کند تا نتایج دقیقتری ارائه دهد.
این مدلها به صورت جهانی در پلتفرمهای ModelScope علیبابا کلود و HuggingFace برای استفادههای آکادمیک، تحقیقاتی و تجاری در دسترس هستند.
علیبابا آخرین نسخه مدل هوش مصنوعی تولید ویدئو و تصویر خود را در ماه ژانویه معرفی کرد، که بعداً نام آن را از Wanx به Wan کوتاه کرد، و توانایی آن را در تولید تصاویر بسیار واقعگرایانه برجسته کرد.
این شرکت از آن زمان به رتبهبندی برتر خود در VBench، یک جدول رتبهبندی برای مدلهای تولید ویدئو، اشاره کرده است، جایی که در عملکردهایی مانند تعامل چند شیء پیشتاز است.
روز سهشنبه، علیبابا پیشنمایشی از مدل استدلال QwQ-Max را منتشر کرد که قصد دارد پس از انتشار کامل، آن را به صورت متنباز ارائه دهد.
همچنین این هفته اعلام کرد که قصد دارد حداقل ۳۸۰ میلیارد یوان (۵۲ میلیارد دلار) در سه سال آینده برای تقویت زیرساختهای رایانش ابری و هوش مصنوعی سرمایهگذاری کند.
اخبار تکنولوژی را در سایت خبری مجتمع نوآوری فرداد بخوانید.