علیبابا با مدل زبانی بزرگ QwQ، رقابت در حوزه هوش مصنوعی را داغتر کرد
به گزارش نگاه فناوری:شرکت چینی علیبابا اخیراً از مدل زبانی بزرگ جدیدی به نام Qwen with Questions (QwQ) رونمایی کرده است که با دارا بودن قابلیت استدلال قوی، به عنوان رقیبی جدی برای مدلهای زبان بزرگ مانند o1 از OpenAI مطرح شده است.
QwQ: مدل زبانی بزرگ با تمرکز بر استدلال
مدل QwQ با 32.5 میلیارد پارامتر، قادر است به درخواستهای پیچیده و طولانی با حداکثر 32 هزار توکن پاسخ دهد. یکی از ویژگیهای برجسته این مدل، توانایی آن در استدلال منطقی و حل مسائل پیچیده است. با استفاده از مکانیزمهای استنتاج چند مرحلهای، QwQ میتواند به سؤالاتی که نیازمند تفکر انتقادی و تحلیل اطلاعات هستند، پاسخهای دقیق و موجه ارائه دهد.
برتری در برخی بنچمارکها
نتایج ارزیابیها نشان میدهد که QwQ در برخی بنچمارکهای استاندارد مانند AIME و MATH که توانایی مدل در حل مسائل ریاضی را میسنجند، عملکرد بهتری نسبت به o1-preview داشته است. همچنین، در بنچمارک GPQA که برای ارزیابی استدلال علمی طراحی شده است، QwQ عملکرد بهتری نسبت به o1-mini نشان داده است. با این حال، در زمینه کدنویسی، بنچمارک LiveCodeBench عملکرد بهتری را برای o1 نشان داده است.

شفافیت و قابلیت دسترسی
برخلاف برخی از مدلهای رقیب، علیبابا رویکردی شفاف در مورد مدل QwQ اتخاذ کرده و جزئیات بیشتری را در مورد معماری و آموزش آن منتشر کرده است. همچنین، این مدل به صورت متنباز در اختیار عموم قرار گرفته است که امکان بررسی و توسعه بیشتر آن را فراهم میکند.
چالشها و محدودیتها
علیبابا اذعان کرده است که مدل QwQ هنوز در مراحل اولیه توسعه قرار دارد و برخی محدودیتها مانند مشکلات در ترکیب زبانها یا گیر افتادن در حلقههای استدلالی را دارد. با این حال، این شرکت به طور مداوم در حال بهبود و توسعه این مدل است.

آینده مدلهای زبانی بزرگ
رونمایی از مدل QwQ نشان میدهد که رقابت در حوزه مدلهای زبانی بزرگ بسیار داغ است و شرکتهای مختلف در تلاش برای توسعه مدلهایی با قابلیتهای پیشرفتهتر هستند. با پیشرفت این فناوری، میتوان انتظار داشت که در آینده نزدیک شاهد کاربردهای گستردهتر هوش مصنوعی در حوزههای مختلف مانند آموزش، پزشکی و کسبوکار باشیم.









