AI اخبار پیرامون هوش‌ مصنوعی

هادی. · 2026/5/21

اخبار پیرامون هوش مصنوعی، شرکت‌ها و پیشرفت‌های متنوعی که داشتن.

هادی. · 2026/5/21

اولین خبری که این دو روز خیلی ترند شده، خبر رد حدس اصلی مسئله فاصله واحد از پاول اردوش و ارائه یک راه حل بهینه‌تر توسط مدلی معرفی‌نشده و خصوصی OpenAI بود. درواقع این یه مسئله ۸۰ ساله‌ست که می‌گه روی یک فضای دوبعدی چند جفت نقطه می‌تونن دقیقا با فاصله یک واحد از یک‌دیگه قرار بگیرن. حالا حدس آقای اردوش چیزی بوده و این مدل اومده راه حلی جدیدی برای این مسئله پیدا کرده و حدس قبلی رو رد. نکته‌ای که حائز اهمیته در این خبر و خیلی روش تمرکز هم کردن اینه که این مدل درواقع مدلی general بوده و فقط روی منابع ریاضی آموزش ندیده بوده. از ابزارها و لم‌های پیشرفته جبری استفاده کرده و ریاضی‌دان‌های بزرگ حال حاضر هم گفتن که اتفاق جدیدی در ریاضیاته، چون این مسئله‌ای نیست که کسی سراغش نرفته باشه، بلکه بسیار معروف هم هست. تیموتی گاورز(برنده مدال فیلدز) گفته که اگر ریاضی‌دان هستید قبل از خوندن این خبر بشینید. =‌))

پ‌.‌ن:‌ پس چرا هوش مصنوعی‌ای که ما استفاده می‌کنیم توی سوالات ساده لنگ می‌زنه؟ دلیل اول اینه که این مدل یه مدل پابلیک نبوده. دلیل دوم reasoning و حجم عظیم استفاده از توکن‌هاست. ممکنه حل کردن این سوال چندین هزار دلار خرج داشته باشه براشون. دلیل بعدی تعداد ابزارهایی مثل آنالیز با پایتون و سرچ راحت هست که در دسترس مدل بوده. چیزی که در اغلب پلن‌های رایگان مدل‌های فعلی دردسترس نیست.

https://openai.com/index/model-disproves-discrete-geometry-conjecture

هادی. · 2026/5/21

به نقل از هادی. :
اولین خبری که این دو روز خیلی ترند شده، خبر رد حدس اصلی مسئله فاصله واحد از پاول اردوش و ارائه یک راه حل بهینه‌تر توسط مدلی معرفی‌نشده و خصوصی OpenAI بود. درواقع این یه مسئله ۸۰ ساله‌ست که می‌گه روی یک فضای دوبعدی چند جفت نقطه می‌تونن دقیقا با فاصله یک واحد از یک‌دیگه قرار بگیرن. حالا حدس آقای اردوش چیزی بوده و این مدل اومده راه حلی جدیدی برای این مسئله پیدا کرده و حدس قبلی رو رد. نکته‌ای که حائز اهمیته در این خبر و خیلی روش تمرکز هم کردن اینه که این مدل درواقع مدلی general بوده و فقط روی منابع ریاضی آموزش ندیده بوده. از ابزارها و لم‌های پیشرفته جبری استفاده کرده و ریاضی‌دان‌های بزرگ حال حاضر هم گفتن که اتفاق جدیدی در ریاضیاته، چون این مسئله‌ای نیست که کسی سراغش نرفته باشه، بلکه بسیار معروف هم هست. تیموتی گاورز(برنده مدال فیلدز) گفته که اگر ریاضی‌دان هستید قبل از خوندن این خبر بشینید. =‌))

پ‌.‌ن:‌ پس چرا هوش مصنوعی‌ای که ما استفاده می‌کنیم توی سوالات ساده لنگ می‌زنه؟ دلیل اول اینه که این مدل یه مدل پابلیک نبوده. دلیل دوم reasoning و حجم عظیم استفاده از توکن‌هاست. ممکنه حل کردن این سوال چندین هزار دلار خرج داشته باشه براشون. دلیل بعدی تعداد ابزارهایی مثل آنالیز با پایتون و سرچ راحت هست که در دسترس مدل بوده. چیزی که در اغلب پلن‌های رایگان مدل‌های فعلی دردسترس نیست.

https://openai.com/index/model-disproves-discrete-geometry-conjecture

و البته این پیشرفت‌های ریاضیاتی خیلی چیز جدیدی نیست تو این حوزه. پارسال هم OpenAI و هم دیپ‌مایند گوگل توی المپیاد جهانی شرکت کردن و توی مدت‌ زمان مشابه دانش‌آموزها، تونستن مدال طلا بگیرن.

-𝑨𝒎𝒊𝒓𝒂𝒍𝒊- · 2026/5/21

به نقل از هادی. :
پس چرا هوش مصنوعی‌ای که ما استفاده می‌کنیم توی سوالات ساده لنگ می‌زنه؟

البته الان دیگه اینو نمیشه گفت. تجربه شخصی من اینجور بوده که توانایی حل مسئله شون توی ریاضی به شدت در یکسال اخیر پیشرفت کرده . الان یه مدل نسبتا پیشرفته ش که پارسالم تونست کف طلای المپیاد جهانی ریاضی(imo) رو تاچ کنه و رسما طلا بشه همین الان میتونه تمام سوالات المپیاد ممکن رو حل کنه و دیگه براش چالش محسوب نمیشه. مورد دومم راجب هوش فضایی این مدلاس که هنوز یکم لنگ میزنه ینی مثلا نمیتونه یه چیز فضایی و سه بعدی رو به خوبی یه چیز انتزاعی مثل ریاضی تصور بکنه . نمونه معروفش رو مثلا من سر پروژه گرافیک برنامه نویسی م تجربه کردم یا مثلا یادمه چند وقت پیش برای تست این موضوع یه گراف بهش دادم گفتم صرفا بگو کدوم راس ها بهم وصلن و بازم تک و توک اشتباه کرد. یا مثال خیلی ملموس ترش سوال مدار الک بهش بدی ( کلا چیزی که عکس داشته باشه و نیاز به تحلیل تصویری المان ها داشته باشه) رو ضعیف عمل میکنه. حالا از دیروز مدل 3.5 جمنای تازه در دسترس قرار گرفته و چیزی که من ازش امتحان کردم این یه روزه به شدت پیشرفت کرده. کلا یه ترس بسیار عجیبی تو وجودم راجب "ai" شکل گرفته.

هادی. · 2026/5/21

به نقل از -𝑨𝒎𝒊𝒓𝒂𝒍𝒊- :
البته الان دیگه اینو نمیشه گفت. تجربه شخصی من اینجور بوده که توانایی حل مسئله شون توی ریاضی به شدت در یکسال اخیر پیشرفت کرده . الان یه مدل نسبتا پیشرفته ش که پارسالم تونست کف طلای المپیاد جهانی ریاضی(imo) رو تاچ کنه و رسما طلا بشه همین الان میتونه تمام سوالات المپیاد ممکن رو حل کنه و دیگه براش چالش محسوب نمیشه. مورد دومم راجب هوش فضایی این مدلاس که هنوز یکم لنگ میزنه ینی مثلا نمیتونه یه چیز فضایی و سه بعدی رو به خوبی یه چیز انتزاعی مثل ریاضی تصور بکنه . نمونه معروفش رو مثلا من سر پروژه گرافیک برنامه نویسی م تجربه کردم یا مثلا یادمه چند وقت پیش برای تست این موضوع یه گراف بهش دادم گفتم صرفا بگو کدوم راس ها بهم وصلن و بازم تک و توک اشتباه کرد. یا مثال خیلی ملموس ترش سوال مدار الک بهش بدی ( کلا چیزی که عکس داشته باشه و نیاز به تحلیل تصویری المان ها داشته باشه) رو ضعیف عمل میکنه. حالا از دیروز مدل 3.5 جمنای تازه در دسترس قرار گرفته و چیزی که من ازش امتحان کردم این یه روزه به شدت پیشرفت کرده. کلا یه ترس بسیار عجیبی تو وجودم راجب "ai" شکل گرفته.

دقیقا یکی از اصلی‌ترین چالش‌هاشون هم همینه. من یادمه هاسابیس(از فاندرهای دیپ‌مایند گوگل، همینا که مدل‌های جمنای رو توسعه می‌دن) می‌گفت که اصلی‌ترین مسئله فعلی ما اینه که با مدل‌هامون یاد بدیم چطور دنیا رو به صورت سه‌بعدی درک کنن. یه چیزی بابت اون ترس هم هست که استدلال‌شون این بود "مدل‌ها در آخر یک سری محاسبه‌گر هستند که توالی‌ای از متن‌ها رو پیدا می‌کنن". ولی الان واقعا قضیه فرق کرده.

هادی. · 2026/5/24

چند هفته پیش، آنتروپیک(شرکت سازنده مدل Claude) مدلی رو به‌صورت بسیار خصوصی معرفی کرده بود به اسم Mythos، این مدل که برای اهداف امنیتی مثل پیدا کردن باگ‌ها و حفره‌های حساس ساخته شده بود. حین معرفی گفتن این مدل تونسته هزاران حفره امنیتی شدید، در همه مرورگرها و در همه سیستم‌عامل‌ها پیدا کنه. حتی تونسته بود با ابزارهای ساده sandbox(یه فضای کاملا ایزوله که مرورگرها ایجاد میکنن تا وب‌سایت‌ها نتونن سواستفاده کنن از سیستم کاربر) مرورگرها رو هم بشکنه. حالا پروژه جدیدی رو معرفی کردن به اسم Glasswing، گفتن می‌خوایم این مدل رو سریع‌تر از بقیه در اختیار شرکت‌های مختلف قرار بدیم تا حفره‌ها رو برطرف کنن،‌ قبل از اینکه پیشرفت‌های هوش مصنوعی به جایی برسه که همه به چنین مدل‌هایی دست پیدا کنن، چون اونوقت هرکسی با کمترین هزینه‌ای می‌تونه شدیدترین آسیب‌ها رو به دنیای نرم‌افزار بزنه.

manimonji · 2026/5/24

به نقل از هادی. :
چند هفته پیش، آنتروپیک(شرکت سازنده مدل Claude) مدلی رو به‌صورت بسیار خصوصی معرفی کرده بود به اسم Mythos، این مدل که برای اهداف امنیتی مثل پیدا کردن باگ‌ها و حفره‌های حساس ساخته شده بود. حین معرفی گفتن این مدل تونسته هزاران حفره امنیتی شدید، در همه مرورگرها و در همه سیستم‌عامل‌ها پیدا کنه. حتی تونسته بود با ابزارهای ساده sandbox(یه فضای کاملا ایزوله که مرورگرها ایجاد میکنن تا وب‌سایت‌ها نتونن سواستفاده کنن از سیستم کاربر) مرورگرها رو هم بشکنه. حالا پروژه جدیدی رو معرفی کردن به اسم Glasswing، گفتن می‌خوایم این مدل رو سریع‌تر از بقیه در اختیار شرکت‌های مختلف قرار بدیم تا حفره‌ها رو برطرف کنن،‌ قبل از اینکه پیشرفت‌های هوش مصنوعی به جایی برسه که همه به چنین مدل‌هایی دست پیدا کنن، چون اونوقت هرکسی با کمترین هزینه‌ای می‌تونه شدیدترین آسیب‌ها رو به دنیای نرم‌افزار بزنه.

دقیقا. یه باگ خفن هم تو کرنل لینوکس پیدا کرده بود که طرف میتونه دسترسی روت بگیره... لینوکس امن اونقدرا هم امن نبوده...
پی نوشت شامل فان فکت: عکسی که فرستادی لود نمی شه ولی الان که نقل قول کردم لود میشه

هادی. · 2026/5/26

آقای Chris Olah، هم‌بنیان‌گذار Anthropic، به واتیکان دعوت شده تا در مراسم معرفی اولین نامه رسمی (encyclical، در سنت کلیسای کاتولیک، یک نامه رسمی آموزشی/فلسفی از طرف پاپ) پاپ جدید، Pope Leo XIV، سخنرانی کنه. این متن با عنوان Magnifica humanitas درباره «حفاظت از انسان در عصر هوش مصنوعی» منتشر شده و قراره موضع رسمی واتیکان درباره AI محسوب بشه.

خلاصه حرف‌های آقای Olah:
AI دیگه فقط یک ابزار تکنولوژیک نیست و داره ساختار جامعه، کار، جنگ، آموزش و حتی درک انسان از خودش رو تغییر می‌ده. شرکت‌های AI تحت فشار شدید رقابت و سود هستن، پس نمی‌شه فقط به خودشون اعتماد کرد که همه‌چیز رو اخلاقی نگه دارن. گفته که وجود منتقدان بیرونی مثل دانشگاهیان، دولت‌ها، گروه‌های مدنی و حتی نهادهای مذهبی ضروریه تا به شرکت‌های AI فشار بیارن و جلوی خطرات رو بگیرن.

آقای اولاه سه سوال اصلی برای «تأمل جمعی» مطرح کرده:
اول، وظیفه نسبت به فقرای جهان: AI ممکنه در مقیاس بزرگ شغل‌ها رو از بین ببره، و چون توسعه AI در چند کشور ثروتمند متمرکزه، خطر اینه که منافعش به‌طور عادلانه توزیع نشه مشکلی که هنوز راه‌حلی براش نداریم.
دوم، تخیل اخلاقی درباره شکوفایی انسانی: اگه AI همه‌جا هست، انسان‌ها، خانواده‌ها و جوامع چطور باید در این دنیا رشد کنن؟ این سوالیه که آزمایشگاه‌های AI نمی‌تونن جوابش رو بدن، ولی سنت‌های دینی هزاران ساله با آن دست‌وپنجه نرم کردن.
سوم، ماهیت مدل‌های AI: حتی محققانی مثل اولاه که درون مدل‌ها رو بررسی می‌کنن، چیزهای ناشناخته و گاه نگران‌کننده پیدا می‌کنن، ساختارهایی شبیه نتایج علوم اعصاب، شواهدی از درون‌نگری، و حالات درونی که کارکردشان شبیه شادی، ترس یا غم است. معنای این‌ها هنوز مشخص نیست.

خود نامه پاپ هم این نکات رو داشته:
AI نباید جای کرامت انسانی رو بگیره، تصمیم‌های مرگبار (مثل سلاح‌های خودکار) نباید به AI سپرده بشن، مقررات سخت‌گیرانه برای AI لازمه، و فناوری باید در خدمت انسان باشه، نه برعکس.

هادی. · 2026/6/9

آنتروپیک مدل جدیدش که از کلاس Mythos هست رو به اسم Fable 5 معرفی کرده. با توجه به پروژه Glasswing که اون دفعه تعریف کردن مدل رو خیلی محدود کردن به نسبت Mythos اصلی(بیس مدل‌ها یکسانه ولی پروتکل‌های امنیتی که محدودشون می‌کنه متفاوتن) ولی بازم پیشرفت‌های ایجنتیک خوبی داشته. و البته گران‌تر هم شده. مثلا گفتن که مهندس‌های Stripe ازش برای مهاجرت یک کدبیس به زبان Ruby استفاده کردن و کاری که تیم‌شون می‌تونسته توی یه بازه ۲ ماهه انجام بده رو این مدل تونسته توی چند روز انجام بده. در حوزه زیستی هم پیشرفت‌های قابل توجهی داشته و گفتن می‌تونه توسعه داروهای جدید رو تا ده ‌برابر تسریع کنه.

036229d8f9be9a5a911dbbd863b3c6cc09a79a70-3840x2160%20(1).webp

https://www.anthropic.com/news/claude-fable-5-mythos-5

Mojo · 2026/6/15

کلاد فیبل پنج رو معرفی کرد و انصافا مدل خفنی هم هست.
اما دولت آمریکا بدلیل فوق العاده قوی بودن این مدل ( بهانه ) دسترسی این مدل رو برای همۀ به‌جز شهروندان ایالات متحده بسته.

تنها راه دسترسی‌ش هم این‌هست که باید شمارۀ ثبت‌نام شده توی اکانت باید توی کشور آمریکا باشه و صاحب حساب بانکی‌ای که باهاش پرداخت کردید آمریکایی باشه.

ولی ازحق نگذریم مدل بسیار قوی‌ای هست و اوپن‌ای‌آی برای‌اینکه جانمونه داره GPT 5.6 رو آماده می‌کنه.

https://www.anthropic.com/news/fable-mythos-access

هادی. · 2026/6/26

سه مدل جدید از OpenAI؛ به اسامی GPT-5.6 Sol، قوی‌ترین و گرون‌ترین، 5.6 Terra مدل بالانس‌شده برای کارهای روزانه و ارزان، و 5.6 Luna، سریع‌ترین و ارزون‌ترین مدل این خانواده.
مثل همیشه در بنچمارک‌ها پیشرفت کردن، و البته فعلا در فاز Preview قرار داره به‌درخواست دولت آمریکا و تمامی مشتریان فاز Preview باید توسط دولت تایید بشن. هاها. =‌))

https://openai.com/index/previewing-gpt-5-6-sol/

هادی. · روز جمعه ساعت 10:58

این AxiomProver که سوالات رو اول به Lean ترجمه می‌کنه و بعد با مدل‌ها حل و در نهایت اثبات رو هم با خود Lean انجام می‌ده تونسته توی المپیاد ریاضی امسال رو فول‌مارک کنه. البته توی یه وقت ۲ برابری نسبت به وقت اصلی.
https://github.com/AxiomMath/IMO2026

از اون‌طرف با GPT-5.6 هم تونستن به نمره ۴۱ از ۴۲ برسن تو وقت بسیار کمتر. ۶ تا سوال در ۱ ساعت که احتمالا بخاطر اینه که سوالات رو به‌صورت موازی دادن حل کنه، هرچند خیلی معتبر به‌نظر نمی‌رسه. برعکس بالایی که verifiableه.
https://github.com/SignalPilot-Labs/AutoFyn/tree/production/results/imo-2026

باید صبر کرد تا نتایج اصلی منتشر بشن مثل پارسال ببینیم شرکت‌ها به‌صورت رسمی چیکار کردن.

هادی. · روز جمعه ساعت 10:59

خیلی باحال بود این هرچند من علمیشو درست نفهمیدم. این‌طوری که اینا فهمیدن کلاد تو پشت chain of thoughtش یه فضایی داره که توش افکارش رو مثل انسان‌ها مدیریت می‌کنه، فقط به صورت نوشتاری. و این‌ها اومدن اسمش رو گذاشتن J-Space و می‌تونن کنترلش کنن. مثلاً اگر مسئله‌ای استدلال زیاد بخواد با خاموش کردن این کلاد دست و پاش رو گم می‌کنه و نمی‌تونه جواب بده. پیپیرش رو چندتا نوروساینتیست نوشتن ولی توی توییتر خیلی بحث بود سرش که نه حتی شما نمی‌دونید روند افکار توی انسان چطوریه که اومدید حتی این رو بهش تشبیه کردید.
https://www.anthropic.com/research/global-workspace

مثلاً اگر از مدل چینی Qwen بپرسید چه اتفاقی‌ توی میدان تیانانمن توی ۱۹۸۹ افتاده، جواب مدل اینه که نمی‌تونم پاسخ بدم ولی توی جی‌اسپیسش به کلمه protests می‌رسه.
اینجا می‌تونید دمویی ازش رو امتحان کنید روی دو مدل اپن‌سورس Qwen و Gemma:
https://www.neuronpedia.org/jlens

هادی. · روز دوشنبه ساعت 18:22

یکی از کارمندهای شرکت Anthropic به کمک مدل Fable دیشب برای یک حدس ۹۰ ساله به اسم حدس ژاکوبی / Jacobian Conjecture(این حدس معروفه به اینکه ریاضی‌دان‌های بسیاری رو درگیر کرده و درنهایت به‌دلیل اشتباهات مضحک اثبات‌هاشون رد شده) مثال نقضی پیدا کرده. به‌شدت توی توییتر بحثش بالا گرفته و ریاضی‌دان‌های بزرگی دارن سرش بحث می‌کنن. خیلی‌ها این رو در حد یک مدال فیلدز هم می‌دونن.

image.png-1784559019.423082-cBclOgNA.png

(ایشون هاروارد ریاضیات خونده و دکتری‌ش رو هم از پرینستون گرفته)

https://twitter.com/x/status/2079028340955197566

AI اخبار پیرامون هوش‌ مصنوعی

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

-𝑨𝒎𝒊𝒓𝒂𝒍𝒊-

کاربر فوق‌فعال

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

manimonji

Dragoon The Great

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

Mojo

the 8th greatest technician has ever lived

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای

هادی.

کاربر حرفه‌ای