ظهور هوش مصنوعی چینی دیپسیک را با لحظه پرتاب اسپوتنیک مقایسه کردهاند. چون هر دو رویداد نشاندهنده پیشرفتهای فناورانه غیرمنتظرهای هستند که تصورات جهانی موجود را به چالش کشیدند. پرتاب فضاپیمای روسی اسپوتنیک در سال ۱۹۵۷ ایالاتمتحده را غافلگیر کرد و مسابقه فضایی آغاز شد.
بهطور مشابه، توسعه دیپسیک، چشمانداز هوش مصنوعی را مختل کرده و نشان داده است که پیشرفتهای قابلتوجهی را میتوان با منابع کمتری از آنچه پیشتر ضروری تصور میشد، به دست آورد؛ به عبارت دیگر، در روزگاری که شرکتهای بزرگی همچون اوپناِیآی و غولهای فناوری غرب با هزینههای میلیارد دلاری در عرصه هوش مصنوعی مشغول رقابت هستند، ظهور استارتاپ چینی دیپسیک کاسهکوزهها را بهم زد.
آیا واقعاً دیپسیک صنعت را تکان داده یا این موج هیجانی فقط حبابی زودگذر است. ابعاد ژئوپلتیک آن چیست و چه اثری روی بازارهای مالی میگذارد؟
تولد هیجانانگیز یک مدل
در ماهها و سالهای اخیر، حوزه هوش مصنوعی شاهد تحولات چشمگیری بوده است. شرکتهای آمریکایی مانند اوپناِیآی، آنتروپیک، مایکروسافت و گوگل با صرف مبالغ سنگین، مدلهای قدرتمندی را ارایه کردهاند تا روند رشد هوش مصنوعی زبانی را شتاب دهند. در این میان، استارتاپی چینی به نام دیپسیک (Deepseek) با ادعای ساخت مدلی همتراز یا حتی بهتر از چتجیپیتی و با هزینه بسیار کمتر، مانند بمبی خبری در صنعت هوش مصنوعی عمل کرده است.
آنچه موضوع را جالبتر میکند این است که دیپسیک از سیستم متنباز رونمایی کرده و ادعا دارد که مدل خود را نه با تراشههای فوقپیشرفته H100 اِنویدیا، بلکه با نسخههای قدیمیتر یا تعدیلشده همین تراشه آموزش داده است. بسیاری از تحلیلگران، سرمایهگذاران و حتی دولتها میپرسند: «آیا این آغاز فروپاشی انحصار غرب بر هوش مصنوعی خواهد بود؟»
در ادامه سعی میکنیم با رویکردی انتقادی، صحت و سقم ادعای این استارتاپ چینی، پیامدهای احتمالی برای سایر کشورها، بازارهای مالی، ژئوپلتیک و همچنین جنبههای اخلاقی و حقوقی آن را بررسی کنیم. از سویی، به
ضرورت نگاه عمیقتر به مساله میپردازیم و نقاط مبهم، در کنار فرصتها و تهدیدهای این فناوری، مطرح خواهند شد.
چالش هزینههای سنگین و دادههای انبوه
مدلهای زبانی بزرگ (LLMs) الگوریتمهایی هستند که با پردازش حجم عظیمی از متن، توان پاسخگویی، تولید متن، ترجمه و انجام طیف گستردهای از وظایف زبانی را به دست میآورند. این مدلها در سالهای اخیر با پیشرفت سختافزارهای پردازشی (بهویژه GPUها) و دردسترس قرارگرفتن کلانداده رشد قابلتوجهی داشتهاند.
برای ساختن یک مدل زبانی بزرگ و قدرتمند، معمولاً نیاز به دهها یا حتی صدها میلیارد شاخص است. هرچه پارامترها بیشتر باشند، مدل در تئوری توانمندتر میشود. این افزایش پارامتر اما با پیچیدگی و هزینه سنگین محاسباتی همراه است. شرکت اوپناِیآی برای توسعه جیپیتی۴ یا مدلهای پیشین، زمان و منابع بسیار زیادی صرف کرده است.
در همین حال، شرکتهایی همچون مایکروسافت و آمازون نیز در ساخت یا میزبانی زیرساخت ابری برای ارایه خدمات هوش مصنوعی مشارکت دارند.
این سرمایهگذاریها موجب شده بسیاری تصور کنند ورود به عرصه مدلهای هوش مصنوعی، نیازمند سرمایه میلیارددلاری و پشتوانه چندین ساله در حوزه سختافزار و تحقیقات باشد. دیپسیک اما ادعا میکند که این نگرش را میتوان با اتخاذ رویکردهای تازه کنار گذاشت.
یادگیری نظارتشده در برابر یادگیری تقویتی
همانطور که میدانید ماشینها یا سیستمهای رایانهای میتوانند از دادهها بیاموزند و با تکرار و آموزش مداوم، عملکرد خود را بهتر کنند و ما به این روش میگوییم «یادگیری ماشین». بسیاری از مدلها در ابتدا با روش یادگیری نظارتشده(Supervised Learning) آموزش میبینند؛ یعنی از دادههای برچسبگذاریشده برای یادگیری الگوها استفاده میکنند. اما با گسترش کاربرد یادگیری تقویتی(Reinforcement Learning)، برخی شرکتها موفق شدهاند هزینه و میزان دخالت انسانی در آموزش را کاهش دهند. در این روش، الگوریتمهایی طراحی میشود که بدون اینکه بهطور مستقیم و خطبهخط برنامهریزی شده باشند، میتوانند الگوها را بشناسند و وظایفی را انجام دهند. اگر ادعای دیپسیک درباره سادهسازی مسیر آموزش مدلهای بزرگ زبانی درست باشد، ممکن است شاهد کاهش محسوسی در هزینه ساخت و زمان توسعه مدلهای هوش مصنوعی باشیم.
دیپسیک، محصول نوابغ چینی
«لیانگ ونفنگ» (Liang Wenfeng) همان کسی است که توانست در کمتر از دو سال دیپسیک را به یکی از استارتاپهای پیشرو در زمینه هوش مصنوعی تبدیل کند. او در سال ۱۹۸۵ در شهر ژانجیانگ چین به دنیا آمد و از همان دوران کودکی علاقه خاصی به ریاضیات و حل مسایل پیچیده نشان داد. مهارتهای تحلیلی او در حل معادلات ریاضی و مسایل ذهنی، مسیر زندگی حرفهای او را شکل داد و در سنین نوجوانی او را به یکی از برجستهترین استعدادهای ریاضی تبدیل کرد.
لیانگ ونفنگ در ۱۷سالگی وارد دانشگاه ژجیانگ شد و در آنجا، مهندسی اطلاعات خواند. او در دوران تحصیل خود، با استفاده از ریاضیات توانست ابزارهایی مانند مدلهای احتمالاتی و الگوریتمهای پیشبینی روند بازار را بررسی کند و از این طریق به دنیای فناوری و بازارهای مالی وارد شود. در دوران دانشگاه، او تصمیم گرفت به دنیای مالی ورود کند و روی معاملات الگوریتمی تمرکز کند. گفته میشود او پیشتر در صنعت مالی چین فعالیت داشته و در حوزههایی مانند معاملات الگوریتمی و دادهکاوی تخصص پیدا کرده بود.
در زمانی که بحران مالی ۲۰۰۸، جهان را به لرزه انداخت، لیانگ فرصت را مغتنم شمرد و پژوهشهای خود را در زمینه یادگیری ماشین آغاز کرد. با جمعآوری تیمی از همکاران، او شروع کرد به ساخت برنامههایی که بتوانند بازارهای مالی را سریعتر و دقیقتر از انسانها تحلیل کنند. این پروژه، او را به نقطه عطفی رساند که بعدها به پایهگذاری دیپسیک تبدیل شد.
با ورود به دنیای هوش مصنوعی و تلاش برای ساخت مدلهای هوشمند، لیانگ ونفنگ بهدنبال آن بود که نشان دهد میتوان با هزینههای پایینتر و سختافزارهای کمتر، مدلهایی بسیار کارآمدتر از سیستمهای پیشرفته تولید کرد. برای همین باید گفت دیپسیک-V3 (DeepSeek-V3) بهوضوح نشان داد که ابتکار و مهندسی میتواند هزینههای زیاد و سرمایهگذاریهای کلان را جبران کند.
ونفنگ اعتقاد داشت ظرفیت هوش مصنوعی بسیار فراتر از کاربردهای محدود مالی است و تصمیم گرفت با تشکیل تیمی کوچک اما نخبه، یک مدل هوش مصنوعی قدرتمند خلق کند.
ادعا شده که دیپسیک از همان ابتدای کار، روش متنباز را برای بهاشتراکگذاری مدل خود در پیش گرفت. این گام جسورانه به معنای آن بود که توسعهدهندگان در سراسر جهان میتوانند کد و معماری مدل را بررسی کنند، اشکالات را بیابند و حتی آن را بهینه کنند.
بمب خبری دیپسیک-V3
در اواخر سال ۲۰۲۴، دیپسیک از مدلی رونمایی کرد که دیپسیک -V3 نام داشت. ویژگی اصلیای که همه را شگفتزده کرد این بود که هزینه توسعهاش تنها بین پنج تا ۶ میلیون دلار برآورد شده است؛ رقمی بسیار ناچیز در مقایسه با بودجههای میلیارددلاری شرکتهایی نظیر اوپناِیآی.
این موضوع موجی از تردید و کنجکاوی را برانگیخت: چگونه میتوان با چنین رقمی، مدلی همتراز با پیشرفتهترین نمونههای موجود ساخت؟
گزارشها اشاره دارند که این مدل با استفاده از GPUهای سطح میانی(نسخه تعدیلشده سری H از انویدیا) آموزش دیده است. دیپسیک نیز ادعا میکند که روش یادگیری تقویتی و حذف بخش بزرگی از تعامل انسانی در فرایند آموزش، هزینه و زمان را بهطرز چشمگیری کاهش داده است.
متنباز بودن و پیامدهای آن
متنباز(Open-Source)بودن مدل دیپسیک-V3 را میتوان یکی از جذابترین زوایای این ماجرا دانست. اگر سابقه لینوکس، اندروید یا فایرفاکس را در نظر بگیریم، میتوان متوجه شد که رویکرد متنباز در بسیاری از موارد باعث گسترش سریع و همهجانبه یک فناوری شده است. حال اگر مدلهای زبانی پیشرفته نیز به همین سمت پیش بروند، فضای وسیعتری برای نوآوری در اختیار تیمهای کوچک استارتاپی یا مراکز دانشگاهی قرار میگیرد.
از طرفی، امکان دارد متنباز بودن، چالشهای امنیتی و اخلاقی را افزایش دهد. برخی میترسند که مدلهای متنباز برای اهداف نامناسبی مثل تولید محتوای مخرب، تبلیغات فریبنده یا حتی عملیات سایبری پیشرفته استفاده شوند. همچنین حقوق مالکیت فکری مطرح است؛ اگر ثابت شود بخشی از دادههای آموزشی دیپسیک از خروجی رقبا (مثل جیپیتی۴) برداشت شده، پرسشهای حقوقی درباره سو استفاده از داده و نقض توافقنامههای مربوطه به وجود میآید.
تغییرات در جغرافیای سیاسی
از زمانی که روابط سیاسی آمریکا و چین پرتنش شد، دولت آمریکا تحریمهایی را برای محدودکردن دسترسی چین به تراشههای پیشرفته وضع کرد. انویدیا نیز نسخههایی خاص (مانندH800) را برای بازار چین تدارک دید تا مطابق با محدودیتهای صادراتی آمریکا باشد. پیش از این، چنین تصور میشد که بدون دسترسی به قدرتمندترین تراشههای انویدیا، ساخت مدلهای همسطح با جیپیتی۴ دشوار یا غیرممکن است.
با این حال، ادعای دیپسیک مبنی بر آموزش یک مدل پیشرفته بدون تراشهH100 نشان میدهد که تحریمها الزاماً مانع از پیشرفت کشورها نمیشوند. چهبسا فشارهای بیرونی گاه انگیزهای برای یافتن راهکارهای ارزانتر و ابتکاریتر ایجاد میکنند. اگر در آینده شرکتهای چینی نیز به خودکفایی بیشتر در تولید تراشه نزدیک شوند، معادلات ژئوپولیتیک بهشدت تغییر خواهد کرد.
تایوان و کره جنوبی بهعنوان تولیدکنندگان اصلی تراشههای پیشرفته، در میانه میدان جنگ فناوری قرار دارند. از سویی، شرکتهایی مانند TSMC بخش مهمی از زنجیره تامین را تشکیل میدهند و چشم امید بسیاری از سازندگان تراشه، به خط تولید پیشرفته تایوان است. فشار واشنگتن برای محدودکردن فروش تراشه به چین، در صورت تشدید تنشها میتواند به بحران یا حتی در سناریوهای بدبینانه به اقدام نظامی بینجامد.
این وضعیت پیچیده نشان میدهد که توسعه مدلهای هوش مصنوعی دیگر صرفاً یک رقابت فناوری نیست، بلکه جغرافیای سیاسی را هم متأثر میکند. تصمیمات تجاری بهراحتی میتواند پیشران درگیریهای بزرگتر یا جابهجایی قدرت میان کشورها باشد.
سقوط موقت یا ترکیدن حباب؟
پس از اعلام خبر مدل دیپسیک، سهام شرکتهای بزرگی همچون انویدیا و برادکام سقوط قابلتوجهی را تجربه کرد. بسیاری این پرسش را مطرح کردند که آیا «حباب هوش مصنوعی» درحال ترکیدن است؟ اما برخی دیگر معتقدند این اتفاق تنها یک شوک مقطعی و دستپاچگی سرمایهگذاران در واکنش به یک خبر هیجانانگیز بوده و بعد از مدتی، بازارها به تعادل میرسند. اگر دیپسیک یا مدلهای مشابه نشان دهند که بدون ساخت اَبَرکارخانههای دیتاسنتر نیز میتوان مدلهای رقابتی ساخت، بخش عظیمی از این سرمایهگذاریهای زیرساختی ممکن است غیرضروری جلوه کند.
این به معنای بازنگری در الگوهای کسبوکار غولهای ابری و ارایهدهندگان سرویس GPU خواهد بود. شرکتهایی مثل مایکروسافت، آمازون و گوگل هزینههای فراوانی برای ساخت و نگهداری مراکز داده پرداختهاند. از دیدگاه آنها، حتی اگر شوک فعلی بازار موقتی باشد، یک نشانه هشدارآمیز جدی محسوب میشود.
بازتعریف فرصتها و ریسکها
همزمان، برخی صندوقهای سرمایهگذاری خطرپذیر احتمالاً از این تحول سود خواهند برد. چون ورود مدلهای کمهزینهتر به بازار، راه را برای استارتاپهای گوناگون باز میکند و محدودیتهای کلانسرمایه برای ساخت مدلهای اختصاصی کاهش مییابد. این یعنی بازار هوش مصنوعی در میانمدت میتواند پویاتر شود و عرصهای رقابتی میان توسعهدهندگان رقم بزند.
در مقابل، اگر مدلهای پرچمدار آمریکایی ثابت کنند که همچنان کیفیت و دقت بالاتری دارند، ممکن است سرمایهگذاران به آنها وفادار بمانند و تنها به برتری قیمت توجه نکنند. به نظر میرسد این دوگانگی «هزینه در مقابل کیفیت» سالها ادامه خواهد یافت و مسیر آینده را شکل خواهد داد.
مسایل امنیتی و نظامی
یکی دیگر از محورهای انتقادی، نگرانی از استفاده نظامی یا سایبری از مدلهای متنباز است. ابزارهای قدرتمندی که میتوانند حجم انبوهی از دادهها را تحلیل کنند، ممکن است در دست دولتها یا گروههای خرابکار، ابعاد خطرناکی بگیرند. از هک سیستمهای مهم گرفته تا انتشار هدفمند اطلاعات نادرست، دامنه سوءاستفاده زیاد خواهد شد. همین نگرانیها باعث شده برخی سازمانهای نظارتی در غرب، ایده محدودکردن مدلهای متنباز یا وضع قوانین سختگیرانه را مطرح کنند. در مقابل، حامیان آزادی نرمافزار متذکر میشوند که اگر مدلهای هوش مصنوعی در اختیار عموم نباشند، تنها شرکتهای خاص یا حکومتها انحصار فناوری را به دست میگیرند.
فرصتی برای جهان درحالتوسعه
یکی از پرسشهای کلیدی این است که موفقیت ادعایی دیپسیک چه اثری بر سایر کشورها و بازیگران کوچکتر میگذارد. اگر واقعاً نیازی به سرمایه چندین میلیارددلاری و تراشههای فوقپیشرفته برای ساخت یک مدل قابلرقابت وجود نداشته باشد، بسیاری از کشورهای درحالتوسعه یا بازیگران منطقهای نیز میتوانند وارد میدان شوند.
در بسیاری از نقاط جهان، زیرساختهای پیشرفته مراکز داده یا بودجههای نجومی پژوهشی بهآسانی در دسترس نیست. اگر مدلهای بهنسبت کوچکتر یا ارزانتری همچون دیپسیک-V3 رونق پیدا کنند، کشورهایی که تاکنون در صنایع هوش مصنوعی حضور کمرنگ داشتهاند، میتوانند با تشکیل تیمهایی خبره و هدفمند، مدلهای بومی خلق کنند. این موضوع به رشد اکوسیستم استارتاپی و پژوهشی در آن کشورها یاری میرساند.
یکی از مزیتهای بالقوه مدلهای محلی یا منطقهای این است که میتوانند باتوجهبه فرهنگ، زبان و نیازهای خاص مردم منطقه توسعه یابند؛ بهعنوان نمونه، اگر کشورهایی در خاورمیانه یا شمال آفریقا بخواهند مدلهای هوش مصنوعی عربی یا فارسی بسازند، میتوانند از روشهای مشابه دیپسیک الگو بگیرند و نیاز به زیرساختهای فراتر از توان مالی خود نداشته باشند.
البته، این امر صرفاً با متنباز بودن یا ارزانتر شدن سختافزارها میسر نمیشود. باید مساله تامین و آموزش دادههای باکیفیت بومی و همچنین وجود نیروی انسانی متخصص را نیز درنظر گرفت. اما درکل، آنچه دیپسیک مطرح کرده، پنجره جدیدی برای توسعه هوش مصنوعی در خارج از محدوده شرکتهای آمریکایی و اروپایی باز میکند.
از دید اقتصادی
شوک وارده به سهام شرکتهای بزرگ نشانگر این است که بازار به اخباری از این دست بسیار حساس است. ممکن است در آینده نیز با هر خبر مبنی بر ظهور مدلهای کمهزینه جدید، شاهد تلاطم در بورس و ارزش سهام غولهای فناوری باشیم. سرمایهگذاران باید در تحلیلها، امکان رشد رقبای کوچکتر و استفاده از روشهای ابداعی را در نظر بگیرند و صرفاً به دادههای پیشین اتکا نکنند.
از منظر ژئوپلتیک
اگر کشور چین این مسیر را ادامه دهد و شرکتهایی نظیر دیپسیک را تقویت کند، محدودیتهای صادراتی آمریکا احتمالاً ناکارآمدتر جلوه خواهند کرد. این مساله میتواند در بلندمدت به تغییرات مهمی در نظم جهانی فناوری بینجامد.
شرکتهای تایوانی و کرهای که تولیدکننده اصلی تراشه هستند، در وضعیت دشواری قرار میگیرند؛ زیرا سیاستهای دو ابرقدرت میتواند فشار مضاعفی بر آنها اعمال کند.
چشمانداز اخلاقی و امنیتی
متنباز شدن مدلهای بزرگ، خطراتی دارد؛ از جمله گسترش حملات سایبری پیشرفته یا تولید محتوای مخرب.
هنوز مشخص نیست که آیا جامعه جهانی به یک اجماع برای مقررات هوش مصنوعی خواهد رسید یا هر کشور مسیر خود را خواهد پیمود. درمجموع، میتوان گفت ظهور دیپسیک و مدلهایی از این دست، نه یک نقطه پایان و نه یک معجزه بیچونوچراست. آنچه میبینیم، نشانی از روندی کلی در حوزه هوش مصنوعی است که همزمان با پیشرفت الگوریتمها و افزایش دسترسی جهانی به دادهها و ابزارهای متنباز، مسیر را برای بازیگران جدید هموار کرده است. مهمترین نکته این است که فرآیند دموکراتیکتر شدن دسترسی به هوش مصنوعی، با تهدیدها و فرصتهای متعددی همراه است و تنها با رویکردی چندجانبه -شامل تنظیمات حقوقی، تعاملات بینالمللی و آگاهی از چالشهای امنیتی – میتوان این عنصر را تا هر ابعادی بهشکل مطلوب مدیریت کرد.









دیدگاهتان را بنویسید