شرکت OpenAI اعلام کرد که یک مدل هوش مصنوعی داخلی، حدس اردوش درباره مسئله فاصله واحد را که یکی از مسائل مشهور در هندسه محسوب میشود، نقض کرده است.
OpenAI این نتیجه را در اختیار چند ریاضیدان قرار داد و واکنشهای آنها را منتشر کرد. تیم گاورز، برنده مدال فیلدز که بالاترین جایزه ریاضیات محسوب میشود، نوشت که شکی نیست حل مسئله فاصله واحد نقطه عطفی در ریاضیات هوش مصنوعی به حساب میآید.
دنیل لیت، استاد دانشگاه تورنتو، نیز نوشت که این اولین نمونه از نتیجهای است که به طور خودمختار توسط هوش مصنوعی تولید شده و واقعا هیجانانگیز است، نه صرفاً به عنوان یک نشانه از پیشرفتهای آینده.
به جرات میتوان گفت این اولین باری بود که یک سامانه هوش مصنوعی اثباتی برای حل یک حدس باز و مهم ارائه میدهد. هرچند این دستاورد چشمگیر است، اما یک شکست رادیکال با مسیر قبلی پیشرفت هوش مصنوعی در ریاضیات محسوب نمیشود.
سه سال پیش، مدلهای زبانی بزرگ در حل مسائل ساده حسابی هم دچار مشکل بودند. فقط سال گذشته بود که این مدلها توانستند در مسابقات ریاضی دبیرستان موفق عمل کنند. از ماه ژانویه در نشست مشترک ریاضیات که بزرگترین گردهمایی سالانه ریاضیدانان جهان، سامانههای هوش مصنوعی شروع به مشارکت در پژوهشهای ریاضی کردهاند، اما فقط در محیطهای محدود. برای تبدیل خروجی هوش مصنوعی به یک قضیه قابل انتشار، به تفسیر قابل توجهی از سوی انسان نیاز بود.
نتیجه جدید OpenAI گام بعدی در این روند است. این مدل هوش مصنوعی، ایدههای موجود از چندین زیرشاخه ریاضیات را به کار گرفته و اثبات کاملی ساخته. اما هیچ تکنیک واقعاً جدیدی را ابداع نکرده است. بعدها، ریاضیدانان انسانی این نتیجه را پالایش و گسترش دادند.
این وضعیت به آیندهای میانمدت اشاره دارد که در آن ریاضیدانان انسانی و مدلهای هوش مصنوعی مکمل یکدیگرند: هوش مصنوعی دانش وسیعتری از کارهای گذشته نسبت به هر انسان زندهای دارد و تمایل بیشتری برای دنبال کردن راهبردهای اثبات خستهکنندهای که احتمال موفقیتشان کم است، از خود نشان میدهد. اما انسانها هنوز هم میتوانند عمیقتر درباره هر مسئله بیندیشند و پرسشهای جالبتری مطرح کنند.
شاید این وضعیت پایدار نماند. سامانههای هوش مصنوعی با چنان سرعتی در ریاضیات پیشرفت کردهاند که روشن نیست ده سال دیگر ریاضیدانان انسانی چه نقشی، اگر نقشی هم داشته باشند، ایفا خواهند کرد.
پل اردوش یکی از پرکارترین ریاضیدانان تاریخ بود. او در طول زندگی خود بیش از ۱۵۰۰ مقاله نوشت که رکوردی بینظیر است. یکی از بزرگترین استعدادهای او طرح مسائلی بود که بیانشان ساده بود اما ریشهای عمیق داشت.
او در سال ۱۹۴۶ مسئله فاصله واحد را مطرح کرد. فرض کنید تعدادی نقطه در یک صفحه دو بعدی دارید و فاصله بین هر جفت نقطه را اندازه میگیرید. در یک نمودار پنج نقطهای و ده جفت نقطه، سه جفت دقیقاً به فاصله یک واحد از هم قرار دارند. سؤال این است که آیا میتوان نقاط را چنان چید که تعداد جفتهای با فاصله یک واحد بیشتر شود؟ پاسخ مثبت است. با جابهجایی نقاط میتوان تعداد این جفتها را به هفت رساند، اما بیشتر از آن ممکن نیست. همین تحلیل را میتوان برای شش نقطه، هفت نقطه و بیشتر انجام داد، اما با زیاد شدن تعداد نقاط، مسئله به سرعت چنان پیچیده میشود که یافتن جواب دقیق ناممکن میگردد.
به همین دلیل، اردوش به جای یافتن تعداد دقیق فاصلههای واحد برای تعداد مشخصی نقطه، تلاش کرد کران بالا و پایین برای تعداد خطهای به طول یک، بر حسب n نقطه، به دست آورد، به شرط آن که n عدد بزرگی باشد.
برای محاسبه کران پایین، اردوش فرض کرد که نقاط در یک شبکه منظم چیده شدهاند. این احتمالاً بهترین چیدمان نیست، اما اگر او میتوانست نشان دهد نقاط در یک شبکه دارای تعداد معینی جفت با فاصله واحد هستند، آن گاه چیدمان بهینه حداقل آن تعداد را خواهد داشت.
سادهترین گزینه شبکهای است که هر نقطه با همسایههای بالا، پایین، چپ و راست خود فاصله یک داشته باشد. اما اردوش دید که با در نظر گرفتن قطرها میتوان نتیجه بهتری گرفت. اگر فاصله شبکه را کوچکتر کنید، هر نقطه میتواند با تعداد بیشتری از همسایههای خود فاصله یک داشته باشد. اگر فاصله شبکه یک باشد، هر نقطه با چهار همسایه فاصله یک دارد، اما اگر فاصله شبکه یکپنجم باشد، هر نقطه با دوازده همسایه به فاصله یک میرسد.
شرح نتیجه جدید OpenAI شامل نموداری مبهم از نقاط در یک شبکه با خطهای فراوان بود. اگر روی آن یک دایره رسم کنیم، درک نمودار آسانتر میشود. این شیوه به دلیل قضیه فیثاغورس کار میکند: اگر نقطهای به اندازه a واحد در راستای افقی و b واحد در راستای عمودی از نقطه دیگر فاصله داشته باشد، فاصله c میان آن دو از رابطه a²+b²=c² به دست میآید. ترفند این است که عدد c² را چنان انتخاب کنیم که تعداد زیادی جفت عدد صحیح a و b داشته باشیم که a²+b²=c² را برآورده کنند. سپس شبکه را چنان کوچک میکنیم که فاصله هر نقطه با همسایهاش ۱/c شود؛ در آن صورت تعداد زیادی فاصله واحد خواهیم داشت.
برای نمونه، اگر c²=۲۵ را انتخاب کنیم، رابطه فیثاغورس با جفت (۰،۵) یا (۳،۴) برآورده میشود. این معادل دوازده نقطه روی یک دایره است. نمودار OpenAI بر پایه c²=۶۵ ساخته شده که با جفتهای (۱،۸) و (۴،۷) ارضا میشود. یعنی اگر فاصله شبکه ۱/√۶۵ باشد، هر نقطه با شانزده نقطه دیگر فاصله واحد خواهد داشت. اگر c² بزرگتر باشد و به دقت انتخاب شود، تعداد قطرهای با طول صحیح بیشتر و در نتیجه جفتهای فاصله واحد بیشتری خواهیم داشت.
البته اگر c² نسبت به تعداد نقاط شبکه خیلی بزرگ باشد، بسیاری از همسایههای بالقوه که فاصله یک واحد دارند، خارج از شبکه قرار میگیرند. به طور خلاصه، باید c² را انتخاب کرد که به اندازه کافی بزرگ باشد اما نه خیلی بزرگ. اردوش با استفاده از نظریه اعداد و قضیه مجموع دو مربع یاکوبی نشان داد که اندازه بهینه دایره باعث میشود تعداد جفتهای با فاصله واحد سریعتر از تعداد نقاط رشد کند، اما فقط اندکی.
سؤال این بود که آیا میتوان بهتر از این کار کرد؟ اردوش برای یافتن کران بالا، از استدلالی در نظریه گراف استفاده کرد تا نشان دهد تعداد فاصلههای واحد نمیتواند از حدی فراتر رود. اما کران بالای او بسیار سریعتر از بهترین کران پایینی که ساخته بود، رشد میکند.
حدس اردوش این بود که مقدار بهینه بسیار به کران پایین نزدیک است تا کران بالا. او پیشبینی کرد که بیشترین تعداد فاصلههای واحد فقط اندکی سریعتر از تعداد نقاط رشد میکند. به عبارت دقیقتر، اردوش حدس زد تعداد فاصلههای واحد برابر n^(1+o(1)) خواهد بود؛ یعنی برای n به اندازه کافی بزرگ، بیشترین تعداد فاصله واحد از n^(1+ε) برای هر ε>۰ کمتر است. این مقدار میتواند کمی سریعتر از ساختار کران پایین او رشد کند، اما در همان محدوده کلی قرار دارد. اثبات این حدس به مسئله فاصله واحد معروف شد. در هشتاد سال بعد، به نظر میرسید اردوش درست میگوید. اما بعد یک مدل OpenAI او را غلط از آب درآورد.
حدس اردوش بر این بود که برای تعداد زیادی نقطه، یک شبکه مربعی تقریباً به اندازه سایر چیدمانها، جفتهای با فاصله واحد تولید میکند. هوش مصنوعی OpenAI با نشان دادن روشی پیچیدهتر برای چیدن n نقطه که جفتهای بیشتری را دقیقاً در فاصله یک واحد قرار میدهد، نادرستی این حدس را اثبات کرد.
دقیقاً به دلیل پیچیدهتر بودن الگوی جدید نقاط، توضیح مختصر آن دشوار است. اما میتوان آن را اصلاحی هوشمندانه روی شبکه اردوش در نظر گرفت. هوش مصنوعی یک شبکه در فضای با ابعاد بالا ساخت و سپس این ساختار پیچیدهتر را به دو بعد تصویر کرد. و به جای استفاده از شبکه اعداد صحیح با نقاطی مثل (۱،۳) یا (۶-،۳)، از چیزی به نام اعداد صحیح جبری برای ساختن این شبکه پیچیدهتر بهره برد. مشخص شد که این نوع شبکه با ابعاد بالا، ساختاری غنیتر دارد و به هوش مصنوعی اجازه میدهد تعداد بیشتری فاصله واحد را در همان تعداد نقطه جای دهد.
نمایش این چیدمان جایگزین دشوار است، زیرا فقط با تعداد بسیار زیادی از نقاط مزیت خود را نشان میدهد. اما در اینجا یک چیدمان سادهتر از نقاط به روش مشابه ساخته شده، وجود دارد. این چیدمان ۱۳۴۵ نقطه دارد و تنها ۵۹۱۶ فاصله واحد تولید میکند که از ۷۶۳۲ فاصله واحد حاصل از یک شبکه مربعی ۱۲۹۶ نقطهای با روش اردوش کمتر است. اما تصور کلی این را میدهد که چگونه یک الگوی غیرشبکهای میتواند فاصله واحد بیشتری نسبت به شبکه مربعی ایجاد کند.
الگوهای پیچیدهتر نتیجه میدهند. هرچند اثبات مدل OpenAI به صراحت بیان نمیکند که برای n نقطه چند جفت فاصله واحد امکانپذیر است، ولی ویل ساوین، ریاضیدان انسانی، نشان داد که این تعداد حداقل با نرخ n به توان ۱/۰۱۴ رشد میکند. این رقم ممکن است کوچک به نظر برسد، اما وقتی n بسیار بزرگ شود، از تعداد حاصل از روش اردوش بسیار بیشتر خواهد شد.
با این حال، نتیجه هوش مصنوعی مسئله را کاملاً حل نکرده. بهترین کران بالایی که برای تعداد فاصلههای واحد داریم حدود n به توان ۱/۳۳۳ است. برای بستن این شکاف به کار بیشتری نیاز هست. اگر دو هفته پیش و قبل از اعلام OpenAI، در مورد تازهترین مشارکتهای مدلهای زبانی بزرگ در ریاضیات از ما میپرسیدید، احتمالاً به سامانه AlphaEvolve از گوگل دیپمایند اشاره میکردیم.
AlphaEvolve از مدلهای زبانی بزرگ به عنوان موتور یک فرایند بهینهسازی استفاده میکند. اگر بتوانید یک مسئله ریاضی را به قطعه کدی برای بهینهسازی تبدیل کنید که اغلب این کار شدنی است، مدل زبانی بزرگ ممکن است برای انواع خاصی از مسائل، راه حلهای بهتری از آنچه انسان یافته، پیدا کند. در ماه نوامبر، چهار ریاضیدان از جمله ترنس تائو مقالهای منتشر کردند که عملکرد AlphaEvolve را روی ۶۷ مسئله بهینهسازی در سراسر ادبیات ریاضی تحلیل میکرد. آنها دریافتند که AlphaEvolve در برخی موارد توانسته نسبت به ادبیات موجود بهبود ایجاد کند.
این گامی فراتر از مشارکتهای پیشین مدلهای زبانی بزرگ مثل مرور ادبیات بود، اما همچنان نیاز داشت انسان مسئله را در قالب یک مسئله بهینهسازی تعریف کند و خروجی هوش مصنوعی را به ریاضیات قابل استفاده تبدیل نماید. همچنین فقط انواع خاصی از مسائل با این روش قابل بررسی هستند. سؤالات مفهومیتری که عددی برای بهینهسازی ندارند، به راحتی با AlphaEvolve مطالعه نمیشوند.
بنابراین شرکتهای فعال در زمینه هوش مصنوعی روی توسعه سامانههای مدل زبانی بزرگ کار کردهاند که بتوانند مستقیماً جواب درست هر مسئله ریاضی را تولید کنند. نتیجه OpenAI گام مهمی در این جهت است. اما همچنان در الگوی ریاضیات کمکی پیشین قرار میگیرد.
از جمله این که شرکتهای دیگر نیز روی حل مسائل اردوش کار کردهاند. چون اردوش در طول دوران کاری خود صدها مسئله مطرح کرد و ریاضیدان توماس بلوم جمعآوری همه آنها را در وبسایت erdosproblems.com سامان داده، شرکتهای هوش مصنوعی از آنها به عنوان زمین آزمایشی برای ارزیابی سامانههای خود استفاده کردهاند. در ماه ژانویه، کوین بارتو، دانشجوی مقطع کارشناسی دانشگاه کمبریج، به همراه یکی از دوستانش از GPT-5.2 و ارسطوی شرکت Harmonic خواست اولین راه حل خودمختار یک مسئله اردوش را تولید کنند. در ۲۲ مه، دو روز پس از اعلام OpenAI، گوگل اعلام کرد که سامانه هوش مصنوعیاش نه مسئله باز اردوش را حل کرده که دو تای آنها بیش از پنجاه سال بیپاسخ مانده بودند.
برای روشن شدن مطلب، مسئلهای که OpenAI حل کرده از هر کار دیگری که اشاره کردیم چشمگیرتر است. اما راه حل OpenAI بیش از آنکه نتیجه اصلی آن نشان دهد، با تلاشهای پیشین هوش مصنوعی همخوانی دارد.
یکی از دلایلی که مسئله فاصله واحد با وجود شهرت بسیار، هشتاد سال بیپاسخ ماند، این بود که بیشتر مردم فکر میکردند حدس اردوش درست است. اما ابزارهای ریاضی موجود به هیچ وجه قادر به اثبات کران اردوش نیستند. بنابراین ریاضیدانان انتظار داشتند هر اثباتی برای این حدس، شامل ایدهها یا رویکردهای کاملاً جدیدی باشد.
در عوض، همان طور که دیدیم، هوش مصنوعی با بسط دادن ساختار اولیه اردوش، حدس را نقض کرد. این راه حلی هوشمندانه و غیربدیهی بود، اما شباهتی هم به نوع کار بهینهسازی انجام شده توسط سامانهای مثل AlphaEvolve داشت.
این موضوع در برخی پاسخهای ریاضیدانان منعکس شده است. تیم گاورز، ریاضیدان، نوشت وقتی اولین بار نتیجه هوش مصنوعی را شنید، فکر کرد که این سامانه قضیه را اثبات کرده است. او گفت: آن شب را صرف تعدیل جهانبینی خود کردم و فکر میکردم اگر هوش مصنوعی بتواند چنین اثباتی ارائه دهد، شاید خیلی زود کار ریاضیدانان تمام شود. اما صبح روز بعد، گاورز و دیگر داوران بیرونی ایمیلی درباره این نتیجه دریافت کردند و او فهمید که مدل زبانی بزرگ به جای اثبات حدس، آن را نقض کرده است که برایش مایه آرامش بزرگی بود.
راه حل OpenAI همچنین دو ویژگی داشت که نقاط قوت مدلهای هوش مصنوعی را نسبت به انسان برجسته میکرد. نخست، راه حل نهایی به کارگیری تکنیکهای پیچیده از حوزهای کاملاً متفاوت ریاضیات یعنی نظریه اعداد جبری بود. سامانههای هوش مصنوعی روی حجم عظیمی از ریاضیات آموزش دیدهاند و دانش وسیعتری از کارهای پیشین ریاضی نسبت به هر انسانی در جهان دارند. برای یک انسان، حل این مسئله مستلزم داشتن دانش مرتبط با نظریه اعداد جبری و همزمان علاقه به مسئله فاصله واحد بود که ترکیبی نادر است.
دوم، فرایند استدلال آن قدر خستهکننده و ظاهراً ناموفق بود که بیشتر انسانها آن را زحمت نمیدادند. یاکوب تزایمرمن، استاد دانشگاه تورنتو، در سند OpenAI اشاره کرد که خودش به طور مختصر رویکرد مشابهی را برای رد این حدس در نظر گرفته بود. اما این نوع تکنیک زمان زیادی میبرد و اغلب به نتیجه نمیرسد، بنابراین آن پروژه را رها کرد.
از سوی دیگر، هوش مصنوعی میتواند بسیاری از راهبردهای اثبات که به نتیجه نمیرسند را پیش از یافتن یک راهبرد موفق، بررسی کند. OpenAI ممکن است مسئله را بارها اجرا کرده باشد تا یک مدل به راه حل رسیده باشد. در واقع، یک نمودار از OpenAI نشان داد که حتی با حداکثر بودجه توکن، مدل داخلی فقط در نیمی از موارد مسئله را حل میکند.
برای روشن شدن، کاری که سامانه هوش مصنوعی انجام داد همچنان چشمگیر است. تزایمرمن بعداً در اظهارنظر خود گفت که همیشه وسوسهانگیز است به یک اثبات تمام شده نگاه کنیم و بعد از آن، آن را بدیهی بنامیم. اما همان طور که قبلاً اشاره کردم، این راه حل نقاط قوت سامانههای هوش مصنوعی را نیز به کار میگرفت.
در کوتاهمدت تا میانمدت، این موضوع به جهانی اشاره دارد که در آن مدلهای هوش مصنوعی مکمل انسانها هستند نه جایگزین آنها. سامانههای هوش مصنوعی فهرست مسائل انتخابشده توسط ریاضیدانان انسانی را بررسی میکنند یا به انسانها در یافتن رویکردهای مرتبط از زمینههای به ظاهر نامرتبط ریاضی کمک میکنند. اما بلافاصله جای انسان را در انتخاب سؤالهای مناسب یا توسعه تکنیکهای کاملاً جدید نمیگیرند.
حتی این نتیجه نیز بسیار حاصل همکاری انسان و هوش مصنوعی بود. در حالی که سامانه هوش مصنوعی اثبات را به تنهایی یافت، ریاضیدانان انسانی نتیجه را تأیید کردند. انسانهای دیگری اثباتهای خواناتری نوشتند که ایدههای اولیه هوش مصنوعی را گسترش میداد، مانند ویل ساوین که کران پایین صریحی را همان طور که گفتم یافت.
مشخص نیست این مکملیت تا چه زمانی ادامه یابد. گاورز باقیمانده اظهارنظر خود را به بررسی این موضوع اختصاص داد که آیا آرامشی که با شنیدن خبر نقض حدس توسط هوش مصنوعی احساس کرده، موجه بوده یا نه. او کمابیش نتیجه گرفت که موجه بوده، اما در یک پانویس نوشت که حدس میزند به زودی هوش مصنوعی به سطح بالایی در فعالیتهای دیگر مثل ساختن نظریهها، فرموله کردن تعاریف و طرح سؤالات جالب نیز خواهد رسید.
در یک سال گذشته، از سامانههای هوش مصنوعی که هنوز در مسابقات ریاضی دبیرستان پیروز نشده بودند، به سامانههایی رسیدهایم که میتوانند ریاضیات را به شکل جالبی پیش ببرند. به نظر میرسد سامانههای هوش مصنوعی در کار روی مسائل ریاضی به کار خودمختارتر شدن ادامه دهند.
در عین حال، ما هنوز به طور کامل کشف نکردهایم که مدلهای فعلی در ریاضیات چه تواناییهایی دارند. اندکی پس از اعلام OpenAI، شیائو ما، پژوهشگر پسادکترای دانشگاه میشیگان، دریافت که GPT-5.5 نیز اگر یک سرنخ کوچک داده شود، میتواند نادرستی حدس اردوش را اثبات کند. اگر یک مدل در دسترس عموم بتواند این حدس مشهور را نقض کند و کسی متوجه نشود، چه اکتشافات دیگری امروز میتوانند رخ دهند که هیچ کس به فکر امتحان کردن آنها نیفتاده است؟