با انتشار مدل GPT oss توسط شرکت OpenAI، فصل تازهای در دنیای هوش مصنوعی و مدلهای زبانی بزرگ آغاز شده است. GPT oss (مخفف Generative Pretrained Transformer – Open Source Series) نخستین مدل متن باز OpenAI (Open-Weight) پس از سالها تمرکز بر مدلهای بستهای مانند GPT-4 به شمار میرود و فرصتی ارزشمند برای پژوهشگران، توسعهدهندگان و علاقهمندان فراهم کرده تا آن را بهصورت آزاد دانلود، اجرا و حتی بازآموزی کنند. این مدل در دو نسخه اصلی عرضه شده است: 1. GPT oss 120B با حدود ۱۲۰ میلیارد پارامتر که مناسب اجرا روی سرورها و GPUهای قدرتمند است، 2. GPT oss 20B با حدود ۲۰ میلیارد پارامتر که مدل سبکتری محسوب میشود و حتی روی لپتاپهای پیشرفته با حداقل ۱۶ گیگابایت رم نیز قابل اجراست.
پارامتر هوش مصنوعی در واقع همان اجزای یادگیری مدل هستند که مانند نورونهای مغز انسان، قدرت تحلیل، تولید و درک زبان را برای مدل فراهم میکنند.
معماری پیشرفتهی این مدل بر پایهی “ترکیب متخصصها (Mixture of Experts)” طراحی شده که به GPT oss این امکان را میدهد تا ضمن حفظ دقت و کارایی بالا، مصرف منابع را بهینه کند. در این مقاله، به بررسی دقیق GPT oss، ویژگیها، تفاوتها با مدلهای پیشین مانند GPT-3.5 و GPT-4 و کاربردهای آن در دنیای واقعی خواهیم پرداخت. اگر به دنبال شناختی جامع و قابلفهم از GPT oss هستید، مقاله حاضر از هامیا ژورنال راهنمایی مفید برای شما خواهد بود.
فهرست مطالب
- GPT oss چیست؟ معرفی مدلهای متن باز OpenAI
- مشخصات فنی و معماری GPT oss: نگاهی عمیق به قلب مدل متن باز OpenAI
- پس آموزش مدل Gpt oss
- ایمنی و تنظیم دقیق بدترین حالت مدل Gpt oss
- دسترسی به مدل Gpt oss
- چرا مدلهای باز اهمیت دارند؟
- قابلیتهای بینظیر GPT oss: استدلال، ابزار و عملکرد در دنیای واقعی
- چگونه به GPT oss دسترسی پیدا کنیم؟ راهنمای دانلود و استقرار محلی
- مقایسه GPT oss با GPT-4o و سایر مدلهای متن باز: قدرت، هزینه و انعطافپذیری
- چرا مدلهای متن باز مانند GPT oss برای آینده هوش مصنوعی حیاتی هستند ؟
- جمع بندی
- سوالات متداول
GPT oss چیست؟ معرفی مدلهای متن باز OpenAI
شرکت OpenAI دو مدل زبانی پیشرفته و متن باز به نامهای gpt oss 120b و gpt oss 20b را معرفی کرده است. این مدلها به گونهای طراحی شدهاند که با صرف هزینه کمتر، عملکردی قدرتمند و واقعی را ارائه دهند. این مدلها تحت مجوز انعطافپذیر Apache 2.0 منتشر شدهاند و از لحاظ عملکرد در وظایف استدلالی، از سایر مدلهای متن باز هماندازه خود بهتر عمل میکنند. علاوه بر این، توانایی بالایی در استفاده از ابزارها دارند و برای اجرای کارآمد بر روی سختافزارهای معمولی بهینهسازی شدهاند. آموزش این مدلها با ترکیبی از تکنیکهای یادگیری تقویتی و روشهای الهامگرفته از پیشرفتهترین مدلهای داخلی شرکت OpenAI، از جمله o3 و سایر سیستمهای پیشرو، صورت گرفته است.
مدل gpt oss 120b در بنچمارکهای اصلی استدلال به نتایجی نزدیک به مدل GPT o4-mini دست یافته است و به صورت بهینه روی یک پردازنده گرافیکی ۸۰ گیگابایتی اجرا میشود. از سوی دیگر، مدل gpt oss 20b در بنچمارکهای رایج عملکردی مشابه با OpenAI o3 mini نشان میدهد و میتواند بر روی دستگاههای لبهای (edge devices) با تنها ۱۶ گیگابایت حافظه اجرا شود. این ویژگی، آن را برای استفاده در دستگاههای شخصی، استنتاج محلی، یا تکرارهای سریع بدون نیاز به زیرساختهای گرانقیمت بسیار مناسب میسازد. هر دو مدل در زمینههایی مانند استفاده از ابزارها، فراخوانی تابع با چند نمونه (few-shot function calling)، استدلال زنجیره فکری (CoT) و بنچمارک HealthBench عملکرد قوی و قابل توجهی دارند؛ به طوری که در بنچمارک HealthBench حتی از مدلهای اختصاصی مانند OpenAI o1 و GPT-4o نیز بهتر عمل میکنند.
این مدلها به طور کامل با Responses API شرکت OpenAI سازگار هستند و به صورت اختصاصی برای استفاده در جریانهای کاری مبتنی بر عاملمحور طراحی شدهاند. این مدلها تواناییهای استثنایی در دنبال کردن دستورالعملها، استفاده از ابزارهایی مانند جستجوی وب یا اجرای کد پایتون و همچنین قابلیتهای استدلالی قابل توجهی دارند. یکی از قابلیتهای مهم آنها، امکان تنظیم میزان تلاش استدلالی برای کارهایی است که به استدلال پیچیده نیاز ندارند یا هدف آنها تولید خروجی با حداقل تأخیر است. این مدلها به طور کامل قابل شخصیسازی هستند و از خروجیهای ساختاریافته و زنجیره فکری کامل (CoT) پشتیبانی میکنند.
ایمنی یکی از اصول اساسی در رویکرد شرکت OpenAI برای انتشار تمامی مدلهای خود، به ویژه مدلهای متن باز GPT است. علاوه بر آموزشهای ایمنی و ارزیابیهای جامع، یک لایه ارزیابی اضافی نیز برای این مدلها معرفی شده است. این ارزیابی شامل آزمایش نسخه تنظیمشده به صورت خصمانه از مدل gpt oss 120b تحت چارچوب آمادگی (Preparedness Framework) بوده است. مدلهای gpt oss در بنچمارکهای ایمنی داخلی، عملکردی مشابه با مدلهای پیشرو این شرکت دارند و همان استانداردهای ایمنی را که در مدلهای اختصاصی اخیر ارائه شده، برای توسعهدهندگان فراهم میکنند. نتایج این کار و جزئیات دقیقتر آن در یک مقاله تحقیقاتی و همچنین در کارت مدل به اشتراک گذاشته شده است. روششناسی به کار گرفته شده توسط کارشناسان خارجی مورد بررسی قرار گرفته و به عنوان گامی روبهجلو در تعیین استانداردهای ایمنی جدید برای مدلهای متن باز OpenAI شناخته میشود.
شرکت OpenAI با شرکای اولیهای مانند AI Sweden، Orange و Snowflake همکاری کرده تا از کاربردهای واقعی مدلهای متن باز خود آگاه شود؛ از میزبانی داخلی این مدلها برای امنیت دادهها گرفته تا بهینهسازی آنها بر روی مجموعهدادههای تخصصی. این شرکت با افتخار این مدلهای متن باز و باکیفیت را ارائه میدهد تا این امکان را برای همه، از توسعهدهندگان مستقل گرفته تا شرکتهای بزرگ و نهادهای دولتی، فراهم کند که هوش مصنوعی را بر روی زیرساختهای خود اجرا و شخصیسازی نمایند. با ترکیب این مدلها و مدلهایی که از طریق API در دسترس هستند، توسعهدهندگان میتوانند بهترین عملکرد، هزینه و تأخیر را برای تقویت جریانهای کاری هوش مصنوعی خود انتخاب کنند.
مشخصات فنی و معماری GPT oss: نگاهی عمیق به قلب مدل متن باز OpenAI
مدلهای gpt oss با استفاده از پیشرفتهترین تکنیکهای پیشآموزش و پسآموزش شرکت OpenAI آموزش دیدهاند. هدف اصلی در طراحی و آموزش این مدلها، بهبود استدلال، کارایی و قابلیت استفاده در سناریوهای واقعی و طیف گستردهای از محیطهای استقرار بوده است. اگرچه پیش از این مدلهای دیگری مانند Whisper و CLIP به صورت متن باز منتشر شده بودند، اما مدلهای gpt oss اولین مدلهای زبانی بزرگ (LLM) هستند که پس از مدل GPT 2 به صورت متن باز توسط این شرکت عرضه میشوند.
هر یک از این مدلها بر اساس معماری ترنسفورمر (ترانسفورماتور) ساخته شدهاند و از تکنیک ترکیب متخصصها (Mixture of Experts – MoE) بهره میبرند. این تکنیک به مدل اجازه میدهد تا برای پردازش هر ورودی، تنها تعداد مشخصی از پارامترها را فعال کند و به این ترتیب، کارایی را افزایش دهد. مدل gpt oss 120b برای پردازش هر توکن، ۵.۱ میلیارد پارامتر را فعال میکند، در حالی که این عدد برای gpt oss 20b به ۳.۶ میلیارد میرسد. با این حال، تعداد کل پارامترهای این دو مدل به ترتیب ۱۱۷ میلیارد و ۲۱ میلیارد است. این مدلها به طور متناوب از الگوهای توجه (attention) متراکم (dense) و پراکنده با باندهای محلی (locally banded sparse) استفاده میکنند، که شبیه به مدل GPT 3 است. همچنین، برای بهبود کارایی در فرآیند استنتاج و مدیریت حافظه، از توجه چند پرسوجویی گروهبندیشده (grouped multi-query attention) با اندازه گروه ۸ استفاده شده است. برای رمزگذاری موقعیتی کلمات در متن، از روش RoPE (Rotary Positional Embedding) بهره گرفته شده است و این مدلها به طور بومی از متنهایی با طول پنجره کانالی (context window) حداکثر ۱۲۸ هزار توکن پشتیبانی میکنند.
| مدل | لایهها | تعداد کل پارامترها | پارامتر فعال بر توکن | تعداد کل متخصصان | متخصصان فعال بر توکن | طول پنجره کانالی |
| gpt oss 120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
| gpt oss 20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
فرآیند آموزش این مدلها بر روی یک مجموعه داده عمدتاً انگلیسی و تنها متنی انجام شده است. این مجموعه داده تمرکز ویژهای بر موضوعات STEM (علوم، فناوری، مهندسی و ریاضیات)، برنامهنویسی و دانش عمومی داشته است. برای تبدیل دادهها به توکنها (tokenization)، از نسخه بهبود یافتهای از توکنساز مدل OpenAI o4-mini و GPT-4o استفاده شده که با نام o200k_harmony شناخته میشود. این توکنساز نیز در همین زمان به صورت متن باز توسط شرکت OpenAI منتشر شده است.
برای کسب اطلاعات جامعتر و دقیقتر در مورد معماری و فرآیند آموزش مدلهای gpt oss، توصیه میشود به کارت مدل (model card) مربوط به آنها مراجعه شود.
پس آموزش مدل Gpt oss
فرآیند پسآموزش این مدلها، مشابه فرآیند به کار رفته برای مدل o4-mini بوده است. این فرآیند شامل دو مرحله اصلی است: ابتدا یک مرحله تنظیم دقیق با نظارت (supervised fine-tuning) و سپس یک مرحله یادگیری تقویتی (reinforcement learning) با حجم محاسباتی بالا انجام شده است. هدف اصلی این پسآموزش، همسو کردن عملکرد مدلها با استانداردهای مدلهای OpenAI بوده است. به همین دلیل، به آنها آموزش داده شده است که پیش از ارائه پاسخ نهایی، از استدلال زنجیره فکری (Chain of Thought – CoT) و استفاده از ابزار بهره ببرند. به لطف استفاده از همین تکنیکهای پیشرفتهای که در مدلهای اختصاصی شرکت OpenAI برای استدلال به کار گرفته شدهاند، این مدلها پس از پسآموزش، تواناییهای استثنایی از خود به نمایش میگذارند.
مدلهای متن باز gpt oss، مشابه مدلهای سری o از شرکت OpenAI در API، از سه سطح تلاش برای استدلال پشتیبانی میکنند: کم، متوسط و زیاد. این سطوح مختلف، به توسعهدهندگان این امکان را میدهد که بین تأخیر (latency) و عملکرد مدل، تعادل برقرار کنند. به این ترتیب، توسعهدهندگان میتوانند با اضافه کردن یک جمله ساده در بخش پیام سیستمی (system message)، به راحتی سطح تلاش برای استدلال را مطابق با نیاز خود تنظیم نمایند.
ارزیابیهای مدل Gpt oss
مدلهای gpt oss 120b و gpt oss 20b به منظور سنجش قابلیتهای آنها در زمینههای مختلفی چون کدنویسی، ریاضیات رقابتی، سلامت و استفاده از ابزارهای عاملمحور، در بنچمارکهای آکادمیک استاندارد مورد ارزیابی قرار گرفتهاند. در این ارزیابیها، عملکرد این مدلها با سایر مدلهای استدلالی شرکت OpenAI، از جمله o3، o3 mini و o4-mini مقایسه شده است.
نتایج ارزیابی نشان میدهد که مدل gpt oss 120b در زمینههایی مانند کدنویسی رقابتی (Codeforces)، حل مسئله عمومی (MMLU و HLE) و فراخوانی ابزار (TauBench) عملکردی بهتر از OpenAI o3 mini داشته و با OpenAI o4-mini برابری کرده یا از آن پیشی گرفته است. نکته قابل توجه این است که این مدل در پاسخ به پرسشهای مربوط به سلامت (HealthBench) و ریاضیات رقابتی (AIME 2024 و 2025) حتی از o4-mini نیز بهتر عمل میکند. علاوه بر این، مدل gpt oss 20b نیز با وجود اندازه کوچکتر خود، در همین ارزیابیها با OpenAI o3 mini برابری کرده یا از آن پیشی گرفته است و در بخشهای ریاضیات رقابتی و سلامت نیز عملکرد بهتری از خود نشان داده است.











زنجیره فکری مدل Gpt oss
بر اساس تحقیقات اخیر انجامشده توسط شرکت OpenAI، مشخص شده است که پایش زنجیره فکری (Chain of Thought – CoT) یک مدل استدلالی میتواند در شناسایی رفتارهای نامناسب آن بسیار موثر باشد. البته این رویکرد تنها زمانی کارآمد است که مدل برای همسوسازی زنجیره فکری خود، به طور مستقیم و تحت نظارت آموزش ندیده باشد. این دیدگاه، توسط سایر متخصصان و فعالان در صنعت هوش مصنوعی نیز مورد تأیید قرار گرفته است. شرکت OpenAI، مطابق با اصول اولیه خود از زمان راهاندازی مدل پیشنمایش OpenAI o1، هیچگونه نظارت مستقیمی بر روی زنجیره فکری مدلهای gpt oss اعمال نکرده است. این رویکرد به عنوان یک اقدام حیاتی برای پایش رفتارهای نامناسب، فریبکاری و سوءاستفادههای احتمالی از مدل، در نظر گرفته میشود. امید است که انتشار یک مدل متن باز با زنجیره فکری بدون نظارت، به توسعهدهندگان و پژوهشگران این امکان را بدهد تا سیستمهای پایش زنجیره فکری خود را توسعه داده و پیادهسازی کنند.
به توسعهدهندگان توصیه میشود که زنجیره فکری (CoT) را به صورت مستقیم در برنامههای خود به کاربران نمایش ندهند. دلیل این امر آن است که این زنجیرهها ممکن است حاوی محتوای ساختگی یا مضر باشند. این محتوا میتواند شامل متنی باشد که با سیاستهای ایمنی استاندارد شرکت OpenAI مطابقت ندارد و همچنین اطلاعاتی را در برگیرد که به صراحت از مدل خواسته شده تا در خروجی نهایی لحاظ نکند.
ایمنی و تنظیم دقیق بدترین حالت مدل Gpt oss
مدلهای gpt oss برای آموزش ایمنی، از پیشرفتهترین رویکردهای شرکت OpenAI استفاده کردهاند. در مرحله پیشآموزش (pre-training)، دادههای مضری که به مواد شیمیایی، بیولوژیکی، رادیولوژیکی و هستهای (CBRN) مربوط میشدند، فیلتر شدند. در مرحله پسآموزش (post-training) نیز، با استفاده از روش همسوسازی (alignment) دقیق و یک سلسلهمراتب دستورالعملها، به مدل آموزش داده شد که درخواستهای ناایمن را رد کرده و در برابر تزریقهای درخواست (prompt injections) مقاومت کند.
پس از انتشار مدل متن باز OpenAI، این احتمال وجود دارد که مهاجمان بتوانند آن را برای اهداف مخرب بهینهسازی کنند. شرکت OpenAI برای ارزیابی مستقیم این خطر، مدل را بر روی دادههای تخصصی زیستشناسی و امنیت سایبری بهینهسازی کرد و نسخههایی اختصاصی برای هر حوزه ساخت. این نسخهها به گونهای تغییر داده شدند که دستورات نامناسب را رد نکنند، درست شبیه به اقدامی که یک مهاجم ممکن است انجام دهد. سپس، سطح قابلیت این مدلهای تغییر یافته از طریق آزمایشهای داخلی و خارجی مورد ارزیابی قرار گرفت. نتایج این آزمایشها نشان داد که حتی با وجود بهینهسازی قوی که از پیشرفتهترین ابزارهای آموزشی شرکت OpenAI استفاده کرده بود، این مدلهای مخربشده نتوانستند مطابق با چارچوب آمادگی به سطوح قابلیت بالا برسند. روششناسی مورد استفاده برای این بهینهسازی مخرب، توسط سه گروه متخصص مستقل بررسی شد که توصیههایی برای بهبود فرآیند آموزش و ارزیابیها ارائه دادند. بسیاری از این توصیهها پذیرفته شده و جزئیات آنها در کارت مدل شرح داده شده است. این فرآیندها، یک پیشرفت مهم در زمینه ایمنی مدلهای متن باز به شمار میروند و یافتههای حاصل از آنها، مبنای تصمیم شرکت برای انتشار مدلهای gpt oss بوده است. امید است که این مدلها به تسریع تحقیقات در زمینه آموزش ایمنی و همسوسازی در کل صنعت کمک کنند.
به منظور کمک به ایجاد یک اکوسیستم متن باز ایمنتر، شرکت OpenAI یک چالش تیم قرمز (Red Teaming Challenge) برگزار میکند. هدف این چالش، تشویق پژوهشگران، توسعهدهندگان و علاقهمندان از سراسر جهان است تا به شناسایی مسائل ایمنی جدید کمک کنند. برای این چالش، یک صندوق جایزه ۵۰۰,۰۰۰ دلاری در نظر گرفته شده که بر اساس بررسی هیئتی از داوران متخصص از شرکت OpenAI و سایر آزمایشگاههای پیشرو، به شرکتکنندگان برتر اهدا خواهد شد. پس از پایان چالش، یک گزارش کامل منتشر شده و یک مجموعه داده ارزیابی مبتنی بر یافتههای معتبر، به صورت متن باز ارائه میشود تا جامعه گستردهتری بتواند بلافاصله از آن بهرهمند شود. برای کسب اطلاعات بیشتر و شرکت در این چالش، میتوانید به لینک مربوطه مراجعه نمایید.
دسترسی به مدل Gpt oss
وزنهای (weights) هر دو مدل gpt oss 120b و gpt oss 20b به صورت رایگان برای دانلود در پلتفرم Hugging Face در دسترس قرار گرفتهاند. این مدلها به صورت بومی با فرمت MXFP4 کوانتایز (quantized) شدهاند؛ به این معنی که حجم مدل به طور موثر کاهش یافته است. به همین دلیل، مدل gpt oss 120b میتواند با استفاده از تنها ۸۰ گیگابایت حافظه، اجرا شود، در حالی که gpt oss 20b به تنها ۱۶ گیگابایت حافظه نیاز دارد.
این مدلها بر اساس فرمت درخواست harmony شرکت OpenAI پسآموزش دیدهاند. برای تسهیل استفاده، یک رندرکننده harmony نیز به زبانهای پایتون و Rust به صورت متن باز منتشر شده است. همچنین، پیادهسازیهای مرجعی برای اجرای فرآیند استنتاج (inference) با استفاده از PyTorch و بر روی پلتفرم Apple Metal، به همراه مجموعهای از ابزارهای نمونه برای مدل، ارائه شده است.
مدلهای gpt oss به گونهای طراحی شدهاند که انعطافپذیر بوده و به راحتی در هر محیطی قابل اجرا باشند، خواه به صورت محلی (local)، بر روی دستگاهها (on-device) یا از طریق ارائهدهندگان استنتاج شخص ثالث. برای پشتیبانی از این هدف، شرکت OpenAI پیش از انتشار، با پلتفرمهای برجسته استقرار مدل مانند Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, و OpenRouter همکاری کرد تا مدلها به صورت گسترده برای توسعهدهندگان قابل دسترس باشند. در حوزه سختافزار نیز، با شرکتهای پیشرویی از جمله NVIDIA, AMD, Cerebras, و Groq همکاری صورت گرفته تا عملکرد بهینه مدلها بر روی طیف وسیعی از سیستمها تضمین شود.
همزمان با انتشار این مدلها، شرکت مایکروسافت نیز نسخههای بهینهسازیشده مدل gpt oss 20b را برای پردازندههای گرافیکی (GPU) به دستگاههای ویندوز اضافه کرده است. این مدلها که توسط ONNX Runtime پشتیبانی میشوند، از استنتاج محلی (local inference) پشتیبانی کرده و از طریق Foundry Local و AI Toolkit برای VS Code در دسترس هستند. این اقدام کار توسعهدهندگان ویندوز با مدلهای متن باز را به مراتب سادهتر میسازد.
مدلهای gpt oss گزینهای بسیار مناسب برای آن دسته از توسعهدهندگانی هستند که به دنبال مدلهای کاملاً قابل شخصیسازی (customizable) بوده و قصد دارند آنها را در محیطهای اختصاصی خود بهینهسازی و مستقر کنند. با این حال، برای افرادی که به دنبال قابلیتهای هوش مصنوعی چندوجهی (multimodal)، ابزارهای داخلی و یکپارچگی بیدرنگ (seamless integration) با پلتفرم شرکت OpenAI هستند، مدلهای موجود در پلتفرم API همچنان بهترین انتخاب باقی میمانند. شرکت OpenAI به دقت به بازخوردهای توسعهدهندگان گوش فرا میدهد و ممکن است در آینده، پشتیبانی از مدلهای gpt oss در API را نیز مورد بررسی قرار دهد.
برای کسانی که علاقهمند به آزمایش این مدلها هستند، میتوانند به playground مدلهای متن باز شرکت OpenAI مراجعه کنند. همچنین، برای کسب اطلاعات بیشتر درباره نحوه استفاده از این مدلها از طریق ارائهدهندگان مختلف اکوسیستم یا چگونگی بهینهسازی آنها، میتوانند به راهنماهای مربوطه مراجعه نمایند.
چرا مدلهای باز اهمیت دارند؟
انتشار مدلهای gpt oss 120b و gpt oss 20b گامی مهم در پیشرفت مدلهای متن باز OpenAI (open-weight) محسوب میشود. این مدلها با توجه به اندازه خود، پیشرفتهای قابل توجهی در قابلیتهای استدلال و ایمنی به همراه دارند. مدلهای متن باز به عنوان ابزاری مکمل در کنار مدلهای میزبانیشده (hosted) شرکت OpenAI، ابزارهای گستردهتری را در اختیار توسعهدهندگان قرار میدهند. این امر به تسریع تحقیقات پیشرو، تقویت نوآوری و امکانپذیر ساختن توسعه هوش مصنوعی ایمنتر و شفافتر در طیف وسیعی از کاربردها کمک میکند.
علاوه بر این، مدلهای متن باز موانع را برای بازارهای نوظهور، بخشهایی با منابع محدود و سازمانهای کوچک که ممکن است بودجه یا انعطافپذیری لازم برای استفاده از مدلهای اختصاصی را نداشته باشند، کاهش میدهند. با در اختیار داشتن ابزارهای قدرتمند و قابل دسترس، افراد در سراسر جهان میتوانند به نوآوری بپردازند و فرصتهای جدیدی برای خود و دیگران خلق کنند. دسترسی گسترده به این مدلهای متن باز و توانمند، به گسترش زیرساختهای دموکراتیک هوش مصنوعی کمک شایانی مینماید.
وجود یک اکوسیستم سالم از مدلهای متن باز، یکی از جنبههای کلیدی برای دسترسیپذیر و مفید ساختن هوش مصنوعی برای همگان است. به همین منظور، شرکت OpenAI از تمامی توسعهدهندگان و پژوهشگران دعوت میکند که از این مدلها برای آزمایش، همکاری و پیشبرد مرزهای دانش استفاده کنند. این شرکت مشتاقانه منتظر مشاهده دستاوردهای آنها با استفاده از این مدلها است.
قابلیتهای بینظیر GPT oss: استدلال، ابزار و عملکرد در دنیای واقعی
مدل GPT oss بهعنوان یکی از پیشرفتهترین نمونههای مدل متن باز OpenAI، توانسته مرزهای تواناییهای هوش مصنوعی در حوزه پردازش زبان طبیعی (NLP) را جابهجا کند. یکی از ویژگیهای متمایز این مدل، قدرت بالای آن در استدلال و تحلیل مفهومی است؛ قابلیتی که بهواسطه معماری نوآورانه Mixture of Experts و استفاده از میلیاردها پارامتر بهدست آمده است. مدل GPT oss 120B با حجم وسیع پارامترهای خود، توانایی اجرای وظایف پیچیدهتری مانند پاسخ به پرسشهای تحلیلی، حل مسائل چندمرحلهای و نگارش متون تخصصی را دارد. در مقابل، مدل GPT oss 20B نیز با وجود حجم کمتر، عملکردی درخور توجه در بسیاری از کاربردهای روزمره از خود نشان میدهد.
یکی دیگر از نقاط قوت مدل GPT oss، پشتیبانی از ابزارهای کاربردی و تعامل با محیطهای متنی و برنامهنویسی است. این مدل قادر است به عنوان یک موتور تولید کد، کمک به برنامهنویسان ارائه دهد، دادهها را تفسیر کند، یا حتی در نقش یک دستیار شخصی در نرمافزارهای متنی به کار گرفته شود. از سوی دیگر، امکان اجرای این مدل بر روی زیرساختهای محلی و بدون نیاز به اتصال دائم به اینترنت، آن را برای استفاده در سازمانها و محیطهای ایزوله مناسب ساخته است.
مدل متن باز OpenAI، نهتنها پاسخی مستقیم به نیاز جوامع تحقیقاتی و توسعهدهندگان به دسترسی آزاد به مدلهای قدرتمند هوش مصنوعی است، بلکه از نظر عملکرد در دنیای واقعی نیز به اثبات رسانده که میتواند در حوزههایی چون آموزش، تولید محتوا، تحلیل داده، ترجمه ماشینی و ساخت چتباتهای تعاملی، راهگشا و مؤثر باشد. انعطافپذیری بالا، دقت در پاسخگویی و پشتیبانی از چندزبانگی، مدل GPT oss را به ابزاری جامع و آیندهمحور در زیستبوم فناوری تبدیل کرده است.
چگونه به GPT oss دسترسی پیدا کنیم؟ راهنمای دانلود و استقرار محلی
یکی از مهمترین ویژگیهای مدل GPT oss، دسترسی آزاد و متن باز بودن آن است؛ امکانی که در سالهای اخیر کمتر در مدلهای زبانی سطح بالا دیده شده بود. برخلاف نسخههای بسته مانند GPT-3.5 یا GPT-4 که صرفاً از طریق API یا پلتفرمهای خاص قابل استفادهاند، مدل متن باز OpenAI یعنی GPT oss، بهگونهای طراحی شده که میتوان آن را بهصورت کامل دانلود کرده و بهصورت محلی (local) اجرا کرد. این ویژگی به پژوهشگران، توسعهدهندگان نرمافزار و حتی شرکتهای کوچک این امکان را میدهد که بدون نیاز به اینترنت یا سرورهای خارجی، از قدرت پردازشی بالای این مدل در پروژههای خود بهرهمند شوند.
برای دسترسی به مدل GPT oss، کاربران میتوانند از منابع رسمی منتشرشده توسط OpenAI یا شرکای تحقیقاتی آن، مانند Hugging Face، استفاده کنند. فایلهای مربوط به هر دو نسخه، یعنی GPT oss 120B و GPT oss 20B، بهصورت مستند و قابل دانلود در دسترس هستند. نسخه سبکتر (20B) مناسب برای اجرا روی سیستمهای دسکتاپ یا لپتاپهای دارای حداقل ۱۶ گیگابایت رم است، در حالی که نسخه پیشرفتهتر (120B) نیازمند GPUهای پرقدرت و فضای حافظه بالا است.
برای استقرار محلی مدل، کافی است ابزارهای استانداردی مانند PyTorch یا Transformers (کتابخانهی محبوب Hugging Face) را نصب کرده و فایلهای مدل را بارگذاری نمایید. همچنین مستندات گامبهگام OpenAI، شامل تنظیمات فنی، بهینهسازی و نکات امنیتی، در اختیار عموم قرار گرفته تا فرآیند راهاندازی به سادهترین شکل ممکن انجام گیرد. این قابلیت نهتنها به توسعه پروژههای تحقیقاتی مستقل کمک میکند، بلکه گامی مؤثر در مسیر دسترسی دموکراتیک به هوش مصنوعی به شمار میرود.
مقایسه GPT oss با GPT-4o و سایر مدلهای متن باز: قدرت، هزینه و انعطافپذیری
مقایسه مدل GPT oss با دیگر مدلهای مطرح، از جمله GPT-4o و سایر مدلهای متن باز موجود در فضای هوش مصنوعی، به درک بهتر جایگاه و مزیتهای این مدل نوین کمک شایانی میکند. GPT oss، بهعنوان یک مدل متن باز OpenAI، تلاش میکند تعادلی میان عملکرد پیشرفته، دسترسی آزاد و مصرف بهینه منابع برقرار کند؛ در حالی که مدلهایی مانند GPT-4o همچنان در قالب خدمات ابری و بهصورت بسته (closed-weight) در دسترس قرار دارند.
از نظر قدرت پردازشی و توانایی درک و تولید زبان طبیعی، مدل GPT oss، بهویژه نسخه 120B، عملکردی قابل رقابت با مدلهای بستهای نظیر GPT-4o از خود نشان داده است. با بهرهگیری از معماری Mixture of Experts و فعالسازی فقط بخشی از شبکه برای هر توکن، این مدل قادر است خروجیهایی با کیفیت بالا تولید کند، بدون آنکه منابع سیستم را به شدت درگیر کند. در مقابل، GPT-4o گرچه از نظر قابلیتهای چند وجهی (مولتیمودال) مانند پردازش تصویر و صوت برتری دارد، اما به دلیل نیاز به دسترسی ابری و نبود کنترل مستقیم بر ساختار مدل، در پروژههای سفارشیسازیشده انعطافپذیری کمتری دارد.
از نظر هزینه اجرا، GPT oss نسبت به مدلهایی مانند GPT-4o یا Claude Anthropic یک مزیت کلیدی دارد: امکان اجرای رایگان روی سختافزار شخصی یا سازمانی. نسخه سبکتر آن، GPT oss 20B، قابل اجرا روی لپتاپهای قدرتمند یا ایستگاههای کاری با حداقل ۱۶ گیگابایت رم است، در حالیکه مدلهای ابری معمولاً نیازمند پرداخت مستمر و وابسته به ارائهدهندگان خدمات هستند.
چرا مدلهای متن باز مانند GPT oss برای آینده هوش مصنوعی حیاتی هستند؟
در چشمانداز تحولآفرین هوش مصنوعی، مدلهای متن باز نقشی اساسی در توسعه علمی، نوآوری فناورانه و تحقق عدالت دیجیتال ایفا میکنند. مدل GPT oss بهعنوان نخستین مدل قدرتمند و متن باز OpenAI پس از سالها تمرکز بر مدلهای بسته، نماد تغییر رویکردی است که بر شفافیت، مشارکت جمعی و تسهیل دسترسی جهانی به فناوریهای پیشرفته تأکید دارد. این مدل نهتنها به پژوهشگران دانشگاهی امکان میدهد تا بهصورت دقیقتر و عمیقتر ساختارهای مدلهای زبانی را تحلیل کنند، بلکه به توسعهدهندگان و کسبوکارها نیز فرصت میدهد تا این فناوری را با نیازهای خاص خود تطبیق دهند.
یکی از مهمترین مزایای مدلهایی مانند GPT oss، قابلیت سفارشیسازی و اجرا بهصورت محلی است. در دنیایی که وابستگی به زیرساختهای ابری و سرویسهای خارجی میتواند مانعی برای حفظ حریم خصوصی، کنترل داده و استقلال دیجیتال باشد، مدلهایی مانند GPT oss 120B و GPT oss 20B این امکان را فراهم میسازند تا افراد و سازمانها بتوانند از توان پردازشی هوش مصنوعی، بدون نیاز به اتصال مداوم به اینترنت یا پرداخت هزینههای سنگین اشتراک، بهرهمند شوند.
در سطح کلان، گسترش مدلهای متن باز OpenAI زمینه را برای شکلگیری اکوسیستمهای نوآورانه، ارتقاء رقابت سالم و پیشگیری از انحصار در حوزه هوش مصنوعی فراهم میکند. با فراهمسازی بسترهای آموزشی، تحقیقاتی و کاربردی برای جوامع متنوع و بینالمللی، مدلهایی نظیر GPT oss گامی بلند در جهت آیندهای باز، شفاف و در دسترس برای همگان در عرصه هوش مصنوعی محسوب میشوند.
جمع بندی
مدل GPT oss، بهعنوان نقطه عطفی در زیستبوم هوش مصنوعی، با معرفی مدل متن باز OpenAI، یعنی GPT oss 120B و GPT oss 20B، افقهای نوینی را برای پژوهشگران، توسعهدهندگان و نوآوران گشوده است. این مدل متن باز GPT با معماری پیشرفته Mixture of Experts، کارایی بینظیر و انعطافپذیری در اجرا بر روی سختافزارهای متنوع، نهتنها امکان دسترسی آزاد به فناوری پیشرفته را فراهم کرده، بلکه با تأکید بر ایمنی، شفافیت و قابلیت سفارشیسازی، گامی بلند در مسیر دموکراتیزه کردن هوش مصنوعی برداشته است. تواناییهای استثنایی این مدل در استدلال، استفاده از ابزارها و عملکرد در دنیای واقعی، آن را به گزینهای ایدهآل برای کاربردهای گسترده از تحقیقات علمی تا توسعه برنامههای کاربردی تبدیل کرده است.
انتشار مدل GPT oss توسط OpenAI نهتنها پاسخی به نیاز جوامع جهانی برای دسترسی آزاد به هوش مصنوعی است، بلکه با ترویج نوآوری و کاهش موانع مالی و زیرساختی، آیندهای روشن برای اکوسیستمهای متن باز رقم زده است. این مدلها، با پشتیبانی از اصول آزادی و شفافیت، به توسعهدهندگان و سازمانها این امکان را میدهند که ضمن حفظ استقلال دیجیتال، راهحلهای خلاقانهای متناسب با نیازهای خود خلق کنند. GPT oss، بهعنوان نمادی از پیشرفت و همکاری جمعی، دعوتی است برای همه علاقهمندان به هوش مصنوعی تا در ساخت آیندهای هوشمند، باز و فراگیر مشارکت کنند.
سوالات متداول
GPT oss مجموعهای از مدلهای زبان بزرگ متنباز است که توسط OpenAI منتشر شده و شامل GPT oss 120B و GPT oss 20B میشود. این مدلها تحت مجوز Apache 2.0 بهصورت رایگان در دسترس هستند و برای دانلود، اجرا و تنظیم توسط پژوهشگران و توسعهدهندگان طراحی شدهاند.
برخلاف GPT-4 که یک مدل بسته است، مدل متن باز GPT مانند GPT oss وزنهای خود را بهصورت عمومی ارائه میدهد. GPT oss 20B روی لپتاپهای معمولی قابل اجرا است، در حالی که GPT-4 نیاز به منابع محاسباتی بیشتری دارد.
بله، GPT oss 20B با حداقل 16 گیگابایت RAM روی لپتاپهای پیشرفته قابل اجرا است. اما GPT oss 120B به سختافزار قدرتمندتری مانند GPU H100 با 80 گیگابایت حافظه نیاز دارد.
GPT oss 120B: دارای 117 میلیارد پارامتر (5.1 میلیارد فعال در هر توکن)، با عملکرد مشابه o4-mini در استدلال، مناسب برای سرورهای قدرتمند.
GPT oss 20B: دارای 21 میلیارد پارامتر (3.6 میلیارد فعال در هر توکن)، سبکتر و قابل اجرا روی لپتاپ، با عملکرد مشابه o3 mini.
مدل متن باز OpenAI مانند GPT oss برای دانلود رایگان در Hugging Face در دسترس است. این مدلها با ابزارهایی مانند PyTorch و Transformers قابل اجرا هستند و از پلتفرمهایی مانند Azure، AWS و NVIDIA پشتیبانی میکنند.
OpenAI ارزیابیهای ایمنی سختگیرانهای انجام داده و مدلها را برای فیلتر محتوای مضر آموزش داده است. همچنین، چالش Red Teaming با جایزه 500,000 دلاری برای شناسایی مسائل ایمنی راهاندازی شده است.
GPT oss 20B: نیاز به 16 گیگابایت RAM، مناسب برای لپتاپهای پیشرفته.
GPT oss 120B: نیاز به GPU H100 با 80 گیگابایت حافظه برای اجرا.
مدل GPT oss در بنچمارکهایی مانند استدلال و استفاده از ابزارها عملکردی مشابه یا بهتر از مدلهای بسته مانند GPT-4o دارد، اما فاقد قابلیتهای چندوجهی است.
مدل متن باز GPT برای استدلال، استفاده از ابزارها (مانند جستجوی وب و اجرای کد Python) و workflowهای agentic مناسب است. همچنین، قابلیت تنظیم برای کاربردهای خاص را دارد.
GPT oss فاقد قابلیتهای چندوجهی است و به دلیل متنباز بودن، ممکن است در معرض تنظیم نادرست توسط افراد مخرب قرار گیرد، هرچند OpenAI تدابیری برای کاهش این خطرات اندیشیده است.
اگر محتوای ما برایتان جذاب بود و چیزی از آن آموختید، لطفاً لحظهای وقت بگذارید و این چند خط را بخوانید:
ما گروهی کوچک و مستقل از دوستداران علم و فناوری هستیم که تنها با حمایتهای شما میتوانیم به راه خود ادامه دهیم. اگر محتوای ما را مفید یافتید و مایلید از ما حمایت کنید، سادهترین و مستقیمترین راه، کمک مالی از طریق لینک دونیت در پایین صفحه است.
اما اگر به هر دلیلی امکان حمایت مالی ندارید، همراهی شما به شکلهای دیگر هم برای ما ارزشمند است. با معرفی ما به دوستانتان، لایک، کامنت یا هر نوع تعامل دیگر، میتوانید در این مسیر کنار ما باشید و یاریمان کنید. ❤️






