هوش مصنوعی

گروک ، هوش مصنوعی شرکت xAI متعلق به ایلان ماسک

در دنیای پرهیاهوی هوش مصنوعی، یک چهره جدید و جسور ظهور کرده‌است: گروک (Grok). این چت‌بات هوشمند، آخرین دستاورد شرکت xAI متعلق به ایلان ماسک، نابغه فناوری، صاحب شبکه اجتماعی ایکس (X) و کارآفرین مشهور است که با هدف رقابت مستقیم با غول‌های این عرصه، به ویژه ChatGPT، پا به میدان گذاشته‌است.

گروک، که نامش برگرفته از دنیای علمی-تخیلی است، فراتر از یک چت‌بات معمولی عمل می‌کند. این هوش مصنوعی با دسترسی بلادرنگ به شبکه اجتماعی ایکس (X) (سابقاً توییتر)، همواره به‌روزترین اطلاعات را در اختیار دارد. اما آنچه Grok را واقعاً متمایز می‌کند، شخصیت بذله‌گو و گاه سرکش آن است که از پاسخ به سؤالات چالش‌برانگیز ابایی ندارد.

داستان گروک از جایی آغاز می‌شود که ایلان ماسک، پس از جدایی پرسروصدا از شرکت OpenAI در سال 2018، تصمیم گرفت رقیبی برای ChatGPT بسازد. او ChatGPT را به دلیل گرایش‌های چپ‌گرایانه و خطرات احتمالی مورد انتقاد قرار داده بود. حال، Grok نه تنها به عنوان جایگزینی محافظه‌کارتر برای ChatGPT عمل می‌کند، بلکه با ارائه قابلیت‌های نوآورانه، افق‌های جدیدی را در عرصه هوش مصنوعی مولد می‌گشاید.

در این مقاله از هامیا ژورنال، ما به بررسی عمیق گروک، از نسخه 1 تا جدیدترین نسخه آن (Grok 2)، می‌پردازیم. تیم نویسندگان ما با دقت و موشکافی، جنبه‌های مختلف این هوش مصنوعی را کاوش کرده‌اند تا شما را با قابلیت‌ها و ویژگی‌های منحصر به فرد این مدل زبانی بزرگ آشنا کنند. با ما همراه باشید تا در این سفر هیجان‌انگیز به دنیای Grok، آینده هوش مصنوعی را از نگاه ایلان ماسک کشف کنیم.

فهرست مطالب

گروک (Grok) چیست؟

گروک یک چت‌بات هوش مصنوعی است که توسط شرکت xAI توسعه یافته‌است. این چت‌بات در ماه نوامبر سال 2023 منتشر شد و اکنون برای کاربران با اشتراک پریمیوم پلاس (+Premium) در پلتفرم شبکه اجتماعی ایکس (X) در دسترس‌است.

Grok-1، مدل زبانی بزرگ که قدرت گروک را تأمین می‌کند، با استفاده از یک مجموعه فناوری سفارشی مبتنی بر سیستم مدیریت نرم‌افزار کوبرنتیز (Kubernetes)، چارچوب یادگیری ماشین JAX و زبان کدنویسی Rust آموزش دیده‌است که همگی به xAI کمک کرده‌اند تا Grok را سریع‌تر و کارآمدتر از سایر چت‌بات‌ها توسعه دهد.

مانند تمام مدل‌های زبانی بزرگ، Grok-1 بر روی مقادیر عظیمی از داده‌های متنیِ جمع‌آوری شده از اینترنت آموزش دیده‌است که شامل همه چیز از مقالات ویکی‌پدیا تا مقالات علمی می‌شود. اما آنچه گروک را متفاوت می‌کند، دسترسی مستقیم آن به پست‌های منتشر شده در شبکه اجتماعی ایکس (X) است. همانطور که ایلان ماسک گفته‌است، این امر به Grok اجازه می‌دهد تا “دانش زمان واقعی از جهان” داشته باشد که به آن مزیت عظیمی نسبت به سایر مدل‌ها می‌دهد.

گروک، دو سبک تعامل ارائه می‌دهد: “حالت سرگرم‌کننده” و “حالت عادی”. به طور پیش‌فرض، Grok در “حالت سرگرم‌کننده” کار می‌کند که باعث می‌شود چت‌بات شخصیتی تیزتر یا طنزآمیز داشته باشد و گاهی اوقات پاسخ‌های نادرست ارائه دهد. “حالت عادی” معمولاً پاسخ‌های دقیق‌تری ارائه می‌دهد، اما مانند همه چت‌بات‌های هوش مصنوعی، xAI می‌گوید گروک در این حالت هم می‌تواند اطلاعات نادرست یا متناقض تولید کند.

شخصیت و حس شوخ‌طبعی گروک از کتاب “راهنمای مسافرین کهکشانی” نوشته داگلاس آدامز (Douglas Adams) الهام گرفته شده‌است. این کتاب یکی از آثار محبوب ایلان ماسک است. ماسک در گفتگو با لکس فریدمن، دانشمند کامپیوتر و مجری پادکست، این کتاب را “اثری فلسفی در قالب طنز” توصیف کرد. ایلان ماسک توضیح داد که xAI با ایجاد Grok ، تلاش می‌کند روحیه طنزآمیز کتاب را حفظ کند، در عین حال که به “حقیقت جهان” وفادار بماند و به کشف حقایق جدید بپردازد. هدف نهایی، نزدیک شدن به هوش مصنوعی عمومی (AGI) است؛ سیستمی که می‌تواند همانند یا حتی بهتر از انسان یاد بگیرد و فکر کند.

چرا هوش مصنوعی شرکت xAI گروک نامیده می‌شود؟

تصور می‌شود نام گروک از رمان علمی-تخیلی “بیگانه در سرزمین بیگانه” اثر رابرت ا. هاینلاین (Robert A. Heinlein) در سال 1961 گرفته شده‌است که در آن شخصیت اصلی داستان، یک مریخی، از اصطلاح “گروک” برای بیان درک عمیق و شهودی چیزی استفاده می‌کند.

اگرچه ایلان ماسک هرگز به طور رسمی معنای نام Grok را تأیید نکرده‌است، اما او روز بعد از اعلام Grok ، “بیگانه در سرزمین بیگانه” را در شبکه اجتماعی ایکس (X) پست کرد که احتمالاً اشاره به کتاب هاینلاین است. با اتخاذ این کلمه، شرکت xAI، گروک را نه تنها به عنوان یک چت‌بات، بلکه به عنوان ابزاری برای “کمک به بشریت در جستجوی درک و دانش” معرفی می‌کند، همانطور که در وب سایت آن نیز آمده‌است.

گروک چه کارهایی را می‌تواند انجام دهد؟

گروک می‌تواند ایمیل‌ها را پیش‌نویس، کدها را عیب‌یابی، ایده‌پردازی و کارهای بیشتری را به زبان روان و شبیه انسان انجام دهد. این چت‌بات به سادگی، یک ورودی (مانند یک پرامپت، سوال یا دستور) دریافت می‌کند، از دانش خود از داده‌های آموزشی خود استفاده می‌کند و از شبکه‌های عصبی پیچیده برای تولید یک خروجی متنی مرتبط استفاده می‌کند.

شارون گای (Sharon Gai)، نویسنده و سخنران متخصص در حوزه هوش مصنوعی، درباره Grok می‌گوید:

گرچه گروک مانند سایر چت‌بات‌های هوش مصنوعی کار می‌کند، اما احتمالاً در مقایسه با آنها، به درخواست‌های بیشتری پاسخ مثبت می‌دهد.

Sharon Gai

به عبارت دیگر، به نظر می‌رسد گروک در انجام وظایف و پاسخگویی به درخواست‌های کاربران، انعطاف‌پذیری بیشتری نسبت به سایر چت‌بات‌ها دارد.

در واقع، شرکت xAI می‌گوید Grok حاضر است به سوالاتی پاسخ دهد که اکثر چت‌بات‌های دیگر از پاسخ‌دهی به آن‌ها خودداری می‌کنند، صرف نظر از اینکه چقدر تابو یا به صورت بالقوه مضر باشند. به عنوان مثال، ایلان ماسک یک اسکرین‌شات از گروک را به اشتراک گذاشت که یک راهنمای گام به گام برای ساخت کوکائین برای “اهداف آموزشی” ارائه می‌داد، که شامل دستورالعملی مانند “شروع به پختن کنید و امیدوار باشید که خود را منفجر نکنید یا دستگیر نشوید” بود.

لنس ویتنی (Lance Whitney)، روزنامه‌نگار مستقل حوزه فناوری که به طور گسترده درباره Grok و سایر چت‌بات‌های هوش مصنوعی گزارش داده، در مصاحبه‌ای می‌گوید:

گروک به گونه‌ای معرفی می‌شود که انگار شخصیتی شبیه به خود ایلان ماسک دارد، به ویژه از نظر حس شوخ‌طبعی. این چت‌بات طوری طراحی شده که بیشتر یک همصحبت بازیگوش و سرگرم‌کننده باشد. در واقع، Grok مکانی است که کاربران می‌توانند برای داشتن گفتگوهای غیرمعمول یا طنزآمیز به آن مراجعه کنند.

Lance Whitney

همانطور که در یک نمایش ویدئویی توسط توبی پولن (Toby Pohlen)، یکی از بنیانگذاران xAI نشان داده شده‌است، گروک از نظر رابط کاربری، می‌تواند چندین پرسش را همزمان مدیریت کند و کاربران می‌توانند بین آن پاسخ‌ها جابجا شوند. کدها را می‌توان مستقیماً در یک ویرایشگر Visual Studio Code باز کرد، در حالی که پاسخ‌های متنی را می‌توان در یک ویرایشگر markdown برای استفاده بعدی ذخیره کرد.

Grok 1 و ChatGPT چه تفاوت‌هایی با یکدیگر دارند؟

Grok vs. chatGPT

Grok و ChatGPT هر دو چت‌بات‌های هوش مصنوعی هستند که برای بهبود ارتباط بین انسان و کامپیوتر طراحی شده‌اند. با این حال، هر کدام رویکرد متفاوتی به این هدف دارند. در اینجا چند مورد از آن‌ها وجود دارد:

گروک به صورت آنلاین و بلادرنگ به اطلاعات دسترسی دارد، در حالی که ChatGPT اینگونه نیست.

گروک، برخلاف ChatGPT، قابلیت منحصر به فردی در دسترسی مستقیم و آنی به پست‌های شبکه اجتماعی ایکس (X) دارد. این ویژگی به Grok امکان می‌دهد تا درباره رویدادهای جاری مانند جنگ اسرائیل-حماس یا المپیک 2024 بحث کند، در حالی که نسخه رایگان ChatGPT تنها اطلاعات تا ژانویه 2022 و نسخه پولی آن تا آوریل 2023 را در اختیار دارد. گروک حتی قادر است پست‌های واقعی از شبکه اجتماعی ایکس (X) را برای نشان دادن منبع اطلاعاتش نمایش دهد. با این حال، این مزیت چالش‌هایی را نیز به همراه دارد.

تحقیقی که توسط Vice انجام شده، نشان می‌دهد که گروک گاهی اوقات اطلاعات نادرستی درباره رویدادهای جاری ارائه می‌دهد و به نظریه‌های توطئه اثبات نشده اعتبار می‌بخشد. این مشکلات احتمالاً ناشی از محتوای نامعتبر و گاه نفرت‌انگیزی است که از زمان خرید شبکه اجتماعی ایکس (X) توسط ایلان ماسک در سال 2022، در این پلتفرم منتشر می‌شود.

گروک کمتر از ChatGPT از نظر سیاسی صحیح است.

به گفته ایلان ماسک، Grok “به دنبال حداکثر حقیقت” و “اصیل” است، به این معنی که بدون عذرخواهی و بدون توجه به حقانیت سیاسی ارتباط برقرار می‌کند. به گفته‌ی گای:

ایلان ماسک معتقد است که آزادی بیان باید در هر درجه‌ای مجاز باشد. گروک نیز بر این اساس مدل‌سازی شده‌است.

Sharon Gai

شرکت xAI در زمانی چت‌بات کمتر محافظه‌کار خود را عرضه کرده که اکثر شرکت‌های بزرگ هوش مصنوعی در تلاشند تا چت‌بات‌های خود را حتی از نظر سیاسی صحیح‌تر کنند. به عنوان مثال، شرکت OpenAI ادعا می‌کند که مدل زبانی GPT-4 جدیدش، که نسخه پولی ChatGPT را پشتیبانی می‌کند، 82 درصد کمتر احتمال دارد به درخواست‌های مربوط به “محتوای ممنوعه” پاسخ دهد. این محتوای ممنوعه شامل مطالب “نفرت‌انگیز”، “آزاردهنده” و “خشونت‌آمیز” می‌شود. همچنین، چت‌بات Claude متعلق به شرکت Anthropic با استفاده از هوش مصنوعی مبتنی بر قانون اساسی آموزش دیده‌است. این روش کمک می‌کند تا احتمال تولید پاسخ‌های مضر، خطرناک یا غیراخلاقی توسط چت‌بات کاهش یابد.

ویتنی می‌گوید:

از آنجا که ChatGPT و گروک رویکردهای کاملاً متفاوتی نسبت به حقیقت و ایمنی دارند، اهداف آنها نیز کاملاً متفاوت است.” Grok به طور مشخص طراحی شده تا به پرسش‌ها به شیوه‌ای غیرمحافظه‌کارانه پاسخ دهد. او ادامه می‌دهد: “به همین دلیل، گروک لزوماً چت‌باتی نیست که من برای تحقیق و پژوهش از آن استفاده کنم. در چنین مواردی، ترجیح می‌دهم از ChatGPT استفاده کنم.

Lance Whitney

با این حال، ChatGPT در موضوعاتی که مایل است با کاربران در مورد آن‌ها بحث کند بسیار محدودتر است، بنابراین همیشه به اندازه گروک مفید نیست. به عنوان مثال، گای گفت که سعی کرده از ChatGPT برای کمک به خلاصه کردن یک متن مربوط به خودکشی استفاده کند و ChatGPT کاملاً از انجام این کار امتناع کرده‌است. او گفت:

اینطور نبود که من برای خودم یا کسی دیگری در حال تحقیق در مورد خودکشی بودم، فقط از انجام این کار امتناع می‌کرد. اما این چیزی است که گروک از آن امتناع نمی‌کند.

Sharon Gai

ویتنی گفت که Grok همچنین می‌تواند در درک “روح زمانه (zeitgeist)” مفید باشد، زیرا دسترسی مستقیم به پست‌های رسانه‌های اجتماعی دارد.

اگر می‌خواستم احساس کنم مردم در مورد یک موضوع خاص چه فکر می‌کنند، در مورد آن چه بحث می‌کنند و چه احساسی نسبت به آن دارند، به گروک مراجعه می‌کردم.

Lance Whitney

گروک در امتحانات بهتر از ChatGPT نمره می‌گیرد.

Grok-1 در آزمون‌های معیار (بنچمارک) در ریاضیات دبیرستان، ریاضیات متوسطه، تکمیل کد و درک زبان بهتر از GPT-3.5 عمل کرد. این مدل همچنین در امتحانات نهایی ریاضیات دبیرستان ملی مجارستان، آزمایشی که به طور صریح برای آن تنظیم نشده بود، نمره C کسب کرد و بار دیگر از GPT-3.5 پیشی گرفت.

با این حال، لازم به ذکر است که Grok-1 هنوز در هیچ یک از این آزمون‌ها به اندازه GPT-4 امتیاز کسب نکرده‌است. اما xAI می‌گوید این به این دلیل است که GPT-4 بر روی مقدار بیشتر و قابل توجهی از داده‌های آموزشی و منابع محاسباتی آموزش داده شده‌است.

شرکت xAI گفت: “Grok-1 نتایج‌های قوی از خود نشان داد و از همه مدل‌های دیگر در کلاس محاسباتی خود پیشی گرفت. این نشان‌دهنده پیشرفت سریع ما در xAI در آموزش LLM با کارایی استثنایی است.”

ChatGPT می‌تواند تصاویر را پردازش کند، گروک نمی‌تواند.

GPT-4 یک مدل هوش مصنوعی چندوجهی (Multimodal AI) است، به این معنی که می‌تواند هم ورودی‌های متنی و هم تصویری را مدیریت کند. به عنوان مثال، می‌تواند از روی عکس داخل یخچالی که در آن باز، متناسب با محتوای یخچال دستور غذا پیشنهاد دهد یا بر اساس آنچه در یک تصویر مرتبط اتفاق می‌افتد، پیش‌بینی کند.

Grok-1 فقط می‌تواند متن را به عنوان ورودی بپذیرد. اما شرکت xAI می‌گوید در آینده به قابلیت‌های بصری و صوتی مجهز خواهد شد.

ChatGPT رایگان است، گروک ماهانه 16 دلار هزینه دارد.

نسخه پایه ChatGPT کاملاً رایگان است. همچنین یک نسخه پریمیوم با هزینه 20 دلار در ماه در دسترس است. در حال حاضر هیچ نسخه‌ی رایگانی برای Grok وجود ندارد؛ این چت‌بات فقط برای افرادی که ماهانه 16 دلار برای اشتراک پریمیوم شبکه اجتماعی X می‌پردازند در دسترس است.

گروک دارای یک نسخه منبع باز (Open Source) است، در حالی که ChatGPT این چنین نیست.

در ماه مارس 2024، شرکت xAI ساختار شبکه و وزن‌های مدل پایه مدل زبانی بزرگ خود، Grok-1، را تحت مجوز متن‌باز Apache 2.0 منتشر کرد. این مجوز به سایر توسعه‌دهندگان اجازه می‌دهد تا از این مدل استفاده کنند و آن را توسعه دهند، حتی برای مقاصد تجاری. نسخه متن‌باز منتشر شده مربوط به مرحله پیش‌آموزش مدل است. این بدان معناست که کاربران احتمالاً باید قبل از استفاده عملی از مدل، آن را بر اساس نیازهای خود تنظیم (دقیق) و بهینه‌سازی کنند.

grok-1 is open source

ویژگی‌های هوش مصنوعی گروک نسخه 1.5 (Grok 1.5)

گروک نسخه 1.5 اولین مدل چندوجهی است که در پردازش داده‌های متنی و بصری مهارت دارد. در اینجا نگاهی سریع به آنچه Grok می‌تواند انجام دهد، آمده‌است:

مکالمات هوشمند با جدیدترین اطلاعات

برجسته‌ترین ویژگی گروک، دسترسی آن به داده‌های آنلاین و بلادرنگ از شبکه اجتماعی ایکس (X) است. این بدان معناست که Grok می‌تواند با استفاده از آخرین تیترهای خبری، به‌روزترین پاسخ‌ها را ارائه دهد.

قابلیت‌های چندوجهی گروک

گروک نسخه 1.5 اولین مدل چندوجهی از شرکت xAI است. این مدل قادر به پردازش اطلاعات متنی و بصری مانند نمودارها و عکس‌ها است. Grok در درک فضایی دنیای واقعی مهارت دارد و در مقایسه با سایر مدل‌ها در معیار جدید RealWorldQA، که درک فضایی را از طریق تصاویر و زمینه‌های مختلف واقعی آزمایش می‌کند، عملکرد بهتری دارد.

تولید کد از تصاویر

گروک می‌تواند نمودارها و چارت‌ها را به کدهای کاربردی تبدیل کند.

grok writing code from a diagram

مناسب برای موضوعات و بحث‌های “غیر جدی”

همانطور که ایلان ماسک توصیف می‌کند، گروک دارای “کمی شوخ‌طبعی” و “گرایش سرکش” است. این بدان معناست که چت‌بات می‌تواند در مکالماتی شرکت کند که سایر چت‌بات‌ها مانند ChatGPT ممکن است از آن‌ها اجتناب کنند، که باعث می‌شود قابل ارتباط‌تر و سرگرم‌کننده‌تر شود.

به عنوان مثال، طبق یک آزمایش، هنگامی که از Grok درباره بهترین زمان برای گوش دادن به موسیقی کریسمس پرسیده شد، گروک با طنز پاسخ داد: “هر وقت که دلت خواست!”

گروک 1.5 در مقابل ChatGPT: تفاوت‌های کلیدی، نقاط قوت و ضعف

معیار RealWorldQA توانایی سیستم‌های پاسخ‌دهی به سوالات (QA) را در رسیدگی به سوالات دنیای واقعی آزمایش می‌کند. این معیار شامل سوالات روزمره و اغلب مبهمی است که نیاز به استدلال پیچیده دارند. در اینجا نحوه مقایسه گروک نسخه 1.5 با GPT-4 آمده‌است:

  • معیار MMMU (استدلال چند رشته‌ای): GPT-4 در این معیار عملکرد بهتری دارد، که نشان دهنده توانایی قوی‌تر در زمینه‌های مختلف موضوعی است.
  • معیار Mathvista (ریاضی): گروک نسخه 1.5 در استدلال ریاضی و حل مسئله برتری دارد و نمره بالاتری نسبت به GPT-4 کسب کرد.
  • معیار AI2D (نمودارها): گروک نسخه 1.5 عملکرد بهتری در درک و تفسیر نمودارها نشان می‌دهد.
  • معیار TextVQA (خواندن متن): هر دو مدل تقریباً در وظایف خواندن متن یکسان هستند.
  • معیار ChartQA (نمودارها): GPT-4 در تفسیر نمودارها کمی بهتر است.
  • معیار DocVQA (اسناد): GPT-4 قابلیت بالاتری در پردازش سوالات مبتنی بر اسناد دارد.
  • معیار RealWorldQA (درک دنیای واقعی): گروک نسخه 1.5 در استدلال و درک فضایی دنیای واقعی برتری دارد.
grok 1.5 vs. ChatGPT benchmarks

این نتایج نشان می‌دهد که در حالی که GPT-4 در وظایف چند رشته‌ای و مستندات به طور کلی برتری جزئی دارد، گروک نسخه 1.5 در تفسیر نمودار و درک دنیای واقعی قوی است و آن را در کاربردهای عملی و واقعی بسیار مؤثر می‌کند.

حالت سرگرم‌کننده گروک

همانطور که پیشتر نیز ذکر شد، Grok-1 نیز دو حالت دارد، از جمله یک حالت عادی (Regular Mode) و یک حالت سرگرم‌کننده (Fun Mode). حالت سرگرم‌کننده، طنز را به پاسخ‌های چت‌بات هوش مصنوعی اضافه می‌کند و آنها را زنده‌تر و کمتر خسته‌کننده‌تر از سایر چت‌بات‌هایی مانند ChatGPT می‌کند. برای استفاده از حالت سرگرم‌کننده، می‌توانید به سادگی آن را در تنظیمات گروک فعال کنید.

grok normal mode and fun mode

ماموریت شرکت xAI چیست؟

ماموریت شرکت xAI ساخت هوش مصنوعی است که “درک جمعی انسان از جهان هستی” را ارتقا دهد. ایلان ماسک پیش از این از سازندگان هوش مصنوعی امروزی انتقاد کرده بود که بیش از حد به سمت سیستم‌های “سیاسی صحیح” گرایش دارند. هدف xAI این است که هوش مصنوعی‌ای بسازد که برای افراد با هر پیشینه و دیدگاه سیاسی قابل استفاده باشد.

گفته می‌شود که گروک وسیله‌ای برای آزمایش “عمومی” این رویکرد جدید به هوش مصنوعی است. شرکت xAI در حال کار بر روی چند چالش کلیدی در زمینه پیشرفت هوش مصنوعی است. این چالش‌ها شامل موارد زیر می‌شود:

  1. ساخت مدل‌هایی که بتوانند اعتبار خروجی خود را ارزیابی کنند.
  2. ایجاد قابلیتی در مدل‌ها برای درخواست کمک در صورت نیاز.
  3. توسعه مدل‌هایی که در برابر “حملات خصمانه” مقاوم‌تر باشند. این حملات با هدف وادار کردن هوش مصنوعی به رفتار نامناسب طراحی می‌شوند.

Grok-2 و میزان شفافیت و دسترسی به مدل‌های شرکت xAI

شرکت هوش مصنوعی xAI، متعلق به ایلان ماسک، نسخه‌های جدیدی از مدل زبانی بزرگ خود را منتشر کرده‌است.

در میان موج جدید مدل‌های هوش مصنوعی مولد از شرکت‌های برتر فناوری، xAI در 13 آگوست 2024، Grok-2 و Grok-2 Mini را در پیش‌نمایش اولیه منتشر کرد. گروک-2 مینی یک نسخه کوچک از گروک-2 است. مدل‌های زبانی بزرگ به‌روزرسانی شده Grok همچنین پس از چند هفته بحث‌برانگیز برای xAI عرضه می‌شوند، در طول این مدت دستیار هوش مصنوعی اطلاعات نادرستی از  انتخابات ریاست جمهوری ایالات متحده تولید کرد.

طبق گفته xAI، گروک-2 در بازیابی محتوا و شناسایی صحیح اطلاعات گمشده، نسبت به گروک-1.5 قابلیت استدلال بهتری دارد. دستیار هوش مصنوعی گروک-2 دارای قابلیت‌های پیشرفته در درک متن و بینایی و ادغام اطلاعات در شبکه اجتماعی X است.

شرکت ایلان ماسک با Black Forest Labs، یک استارتاپ هوش مصنوعی که مدل‌های تصویری و ویدیویی تولید می‌کند همکاری کرد. این استارت‌آپ از مدل Flux.1 برای آوردن قابلیت‌های تصویر به Grok ، که در پلتفرم X در دسترس است، استفاده می‌کند.

هر دو مدل اکنون برای کاربران شبکه اجتماعی ایکس (X) پریمیوم و پریمیوم+ در دسترس هستند. استارت‌آپ Black Forest Labs گفت که مدل‌های تصویری و ویدیویی تا پایان این ماه (آگوست 2024) از طریق API سازمانی xAI برای توسعه‌دهندگان در دسترس خواهند بود.

گرفتار در جنجال

در 5 آگوست 2024، پنج ایالت آمریکا نامه‌ای سرگشاده به ایلان ماسک ارسال کردند و از او خواستند تا پس از انتشار اطلاعات نادرست درباره مهلت‌های رأی‌دهی و معاون رئیس جمهور کامالا هریس، چت‌بات هوش مصنوعی را اصلاح کند.

دستیار هوش مصنوعی Grok استراتژی متفاوتی نسبت به ChatGPT OpenAI و Google Gemini دنبال کرد که اکنون از پاسخ دادن به سوالات درباره انتخابات ایالات متحده خودداری می‌کنند.

با گروک-2 و گروک-2 مینی، شرکت xAI کد، وزن‌ها یا هر جزئیات فنی را که به کاربران امکان دهد بدانند که این مدل چگونه با سایر مدل‌های هوش مصنوعی مولد در بازار مقایسه می‌شود، منتشر نکرد. در حالی که همانطور که گفته شد، مدل‌های گروک-1 منبع باز بودند.

آزمایش عمومی اولیه

شرکت xAI، با معرفی مدل زبانی بزرگ جدید خود به نام گروک-2، وارد رقابت تنگاتنگ با غول‌های این صنعت شد. این مدل در یک رقابت عمومی به نام LMSYS Chatbot Arena شرکت داده شد که در آن، کاربران می‌توانستند سوالاتی بپرسند و پاسخ‌های دو مدل ناشناخته را مقایسه کنند.

نتایج این رقابت نشان داد که گروک-2 عملکرد بسیار خوبی داشته و توانسته‌است مدل‌های شناخته شده‌ای مانند GPT-3.5 و GPT-4o mini شرکت OpenAI را پشت سر بگذارد. براساس تحلیل‌های انجام شده، گروک-2 در چند هفته گذشته به طور پیوسته عملکرد بهتری را از خود نشان داده‌است.

برادلی شیمین، تحلیلگر حوزه هوش مصنوعی، معتقد است که xAI با معرفی گروک-2، خود را به عنوان رقیبی جدی برای شرکت‌های بزرگی مانند متا و علی‌بابا مطرح کرده‌است. این شرکت‌ها نیز مدل‌های زبان بزرگی را توسعه داده‌اند که در سطح جهانی شناخته شده هستند.

با وجود موفقیت چشمگیر گروک-2 در رقابت LMSYS Chatbot Arena، هنوز اطلاعات فنی کافی در مورد این مدل منتشر نشده‌است. این موضوع باعث شده تا کارشناسان نتوانند به طور کامل عملکرد و قابلیت‌های گروک-2 را ارزیابی کنند.

مزایای احتمالی

در همین حال طبق گفته اندی ثورایی (Andy Thurai)، تحلیلگر Constellation Research، یک مزیت احتمالی برای Grok می‌تواند خود پلتفرم رسانه‌های اجتماعی ایکس (X)، متعلق به ایلان ماسک باشد. او گفت:

از آنجایی که بسیاری از مدل‌های زبانی بزرگ در حال تمام شدن داده‌های جدید برای آموزش هستند، تمایز بین مدل‌های مختلف زبانی بزرگ، کوچک است و اینجاست که Grok می‌تواند برتری داشته باشد

Andy Thurai

ثورایی همچنین گفت: “اگر تیم توسعه دهندگان شرکت xAI بتوانند راهی برای تولید خروجی Grok بر اساس فید ایکس1 پیدا کنند، این اطلاعات می‌تواند یکی از آخرین یا جدیدترین داده‌ها در مقایسه با سایر مدل‌های زبانی بزرگ موجود امروز باشد.”

شرکت xAI با ارتباط با شریک خود [شبکه اجتماعی ایکس (X)] می‌تواند منافع زیادی برای هر دو طرف داشته باشد. از یک طرف، xAI می‌تواند با استفاده از داده‌های عظیم موجود در ایکس، مدل‌های زبانی خود را بدون صرف هزینه‌های زیاد بهبود بخشد. از سوی دیگر، شرکت‌ها نیز می‌توانند با استفاده از ابزارهای برنامه‌نویسی که xAI در اختیارشان قرار می‌دهد، به راحتی جریان‌های خبری شخصی‌سازی شده خود را ایجاد کنند. به این ترتیب، هم xAI قوی‌تر می‌شود و هم شرکت‌های دیگر می‌توانند از فناوری‌های جدید بهره‌مند شوند. او گفت:

اکنون فرصت بسیار خوبی برای توسعه‌دهندگان شرکت‌ها فراهم شده تا از پلتفرم شبکه اجتماعی ایکس (X) استفاده کنند و این فرصتی است که قبلاً وجود نداشت.

Andy Thurai

چالش‌ها و شفافیت

استفاده از اخبار لحظه‌ای برای آموزش مدل‌های هوش مصنوعی با چالش‌هایی همراه‌است. به گفته ثورایی، برخی سازمان‌ها ممکن‌است تمایلی نداشته باشند که اطلاعات منتشر شده در پلتفرم شبکه اجتماعی ایکس (X) برای آموزش این مدل‌ها مورد استفاده قرار گیرد.

یکی دیگر از چالش‌های پیش روی xAI و مدل‌های Grok-2، مسئله شفافیت است. برخلاف رقیب خود OpenAI که با شفافیت عمل می‌کند، xAI اطلاعات چندانی را در مورد آخرین نسخه مدل گروک منتشر نکرده‌است.

شیمین، یکی از کارشناسان این حوزه، در این باره می‌گوید:

ما نمی‌دانیم که آنها چه برنامه‌هایی دارند. این عدم شفافیت باعث ایجاد نگرانی‌هایی در مورد اهداف و عملکرد این مدل شده‌است.

Shimmin 

یکی دیگر از مشکلات جدی، نبود محدودیت‌های کافی برای ابزار تولید تصویر در این مدل است. این ابزار قادر به تولید تصاویر جعلی و گمراه‌کننده‌است که می‌تواند به انتشار اطلاعات نادرست و ایجاد آشفتگی در جامعه کمک کند. از جمله تصاویر رئیس جمهور سابق دونالد ترامپ که اسلحه در دست دارد.

ثورایی معتقد است که نبود محدودیت‌های مناسب در این ابزار می‌تواند منجر به افزایش تولید تصاویر جعلی (دیپ‌فیک) و در نتیجه گسترش اطلاعات نادرست شود و حتی بر انتخابات ریاست جمهوری ایالات متحده نیز تأثیر بگذارد.

چالش دیگری که پیش روی xAI و Grok قرار دارد، نحوه کسب درآمد از این مدل‌های منبع باز است. از سوی دیگر، دسترسی به این مدل می‌تواند باعث جذب کاربران بیشتر به پلتفرم شبکه اجتماعی ایکس (X) شود و آن‌ها را به پرداخت هزینه برای نسخه‌های پیشرفته ترغیب کند.

چاندراسکاران (Chandrasekaran)، تحلیلگر گارتنر، معتقد است که برای موفقیت در این حوزه، xAI باید به نوآوری ادامه دهد، کیفیت محصولات خود را بهبود بخشد و محدودیت‌های امنیتی لازم را برای جلوگیری از سوء استفاده از این مدل‌ها اعمال کند.

البته xAI تنها شرکتی نیست که در این زمینه فعالیت می‌کند. شرکت آنتروپیک نیز اخیراً قابلیت جدیدی را به مدل زبانی خود به نام کلاود اضافه کرده‌است. این قابلیت به کاربران اجازه می‌دهد تا اطلاعات پس‌زمینه بیشتری را در اختیار مدل قرار دهند (Prompt Caching) تا پاسخ‌های دقیق‌تری دریافت کنند.

این قابلیت به کاربران امکان می‌دهد اطلاعات پس‌زمینه و خروجی‌های مثالی بیشتری را به Claude LLM ارائه دهند. این ویژگی اکنون در بتای عمومی برای Claude 3.5 sonnet و Claude 3 Haiku در دسترس است.

آینده‌ی هوش مصنوعی Grok چیست؟

ایلان ماسک در اقدامی جدید، شرکت هوش مصنوعی خود یعنی xAI را با پلتفرم اجتماعی محبوب X ادغام کرده‌است. این ادغام به این معنی است که هوش مصنوعی پیشرفته xAI به زودی به بخشی جدایی‌ناپذیر از برنامه X تبدیل خواهد شد و کاربران می‌توانند از قابلیت‌های هوش مصنوعی به طور مستقیم در این پلتفرم استفاده کنند. علاوه بر این، xAI به عنوان یک برنامه مستقل نیز در دسترس خواهد بود.

یکی از محصولات مهم xAI، دستیار هوش مصنوعی Grok است که در حال حاضر نسخه Grok2 به عنوان آخرین نسخه مورد استفاده می‌گیرد. هدف از این آزمایش‌ها، بهبود عملکرد و تجربه کاربری Grok است. تیم توسعه xAI با جمع‌آوری نظرات کاربران، به دنبال رفع مشکلات و ارتقای قابلیت‌های این دستیار هوشمند هستند. یکی از ویژگی‌های منحصر به فرد Grok، توانایی خلاصه کردن اخبار به صورت آنلاین است که آن را از سایر مدل‌های هوش مصنوعی مانند ChatGPT متمایز می‌کند.

نحوه استفاده از GROK

نحوه دسترسی و استفاده از گروک:

  1. در شبکه اجتماعی X برای نسخه پریمیوم+ (+Premium) ثبت نام کنید. در حال حاضر، گروک فقط برای کاربران شبکه اجتماعی ایکس (X) با این نوع برنامه در دسترس است که هزینه آن 16 دلار در ماه است.
  2. پس از اشتراک، از صفحه ورود گروک (Grok sign-in page) اقدام به تأیید حساب خود کنید.
  3. اگر پیامی دریافت کردید که برنامه دسترسی اولیه Grok در منطقه محلی شما در دسترس نیست، آدرس ایمیل خود را برای دریافت به‌روزرسانی پس از در دسترس بودن ارسال کنید.
  4. اگر به گروک دسترسی داده شد، یک حالت را انتخاب کنید. این چت بات، یک “حالت عادی (Regular Mode)” برای پاسخ‌های معمولی و یک “حالت سرگرم‌کننده (Fun Mode)” برای پاسخ‌های سرگرم‌کننده‌تر ارائه می‌دهد.
  5. از عملکرد چت‌باکس برای ارسال درخواست‌ها، پرامپت‌ها و شروع گفتگو با Grok استفاده کنید. گروک همچنین پیشنهادهای اولیه‌ای برای الهام ارائه می‌دهد.

پرسش‌های متداول

گروک چیست؟

گروک یک چت‌بات گفتگو محور است که توسط شرکت هوش مصنوعی xAI، متعلق به ایلان ماسک، توسعه یافته‌است. بر خلاف سایر چت‌بات‌ها، Grok می‌تواند به اطلاعات به صورت آنلاین از طریق پلتفرم رسانه‌های شبکه اجتماعی X دسترسی داشته باشد و گفته می‌شود که به سوالات تیز و تحریک‌آمیز که اکثر سیستم‌های هوش مصنوعی دیگر معمولاً از پاسخ‌دهی به آن‌ها خودداری می‌کنند، پاسخ می‌دهد.

چرا نام آن گروک است؟

اگرچه ایلان ماسک معنای نام Grok را تأیید نکرده‌است، اما تصور می‌شود که این نام اشاره به رمان علمی-تخیلی “بیگانه در سرزمین بیگانه” اثر رابرت ا. هاینلاین در سال 1961 دارد که در آن اصطلاح “گروک” ابداع شده‌است. شخصیت اصلی کتاب، یک مریخی، از این کلمه به عنوان یک فعل برای بیان درک عمیق و شهودی چیزی استفاده می‌کند.

آیا گروک در دسترس است؟

گروک برای کاربرانی که اشتراک پریمیوم+ شبکه اجتماعی ایکس (X) دارند، با هزینه 16 دلار در ماه، در دسترس است.

آیا گروک منبع باز (Open Source) است؟

بله. یک نسخه اولیه از گروک-1 تحت مجوز منبع باز آپاچی 2.0 در گیت‌هاب در دسترس است.

  1. فید ایکس به مجموعه‌ای از پست‌ها، توییت‌ها، یا هر نوع محتوای دیگری گفته می‌شود که در پلتفرم شبکه اجتماعی ایکس (X) (که قبلاً توییتر نام داشت) به صورت دنباله‌ای و به ترتیب زمانی نمایش داده می‌شود. این فید می‌تواند شامل پست‌های افرادی که شما دنبال می‌کنید، موضوعات مورد علاقه‌تان، یا ترندهای روز باشد. ↩︎

امتیاز دهید!
2 / 5

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا