ناگهان حادثه در سان فرانسیسکو در ماه نوامبر، از سام آلتمن، مدیر عامل شرکت هوش مصنوعی OpenAI، پرسیده شد که این حوزه در سال 2024 چه شگفتی هایی به همراه خواهد داشت.
آقای آلتمن به سرعت پاسخ داد که چت ربات های آنلاین مانند ChatGPT OpenAI “گامی رو به جلو خواهند برد که هیچ کس انتظارش را نداشت.”
جیمز مانیکا، مدیر اجرایی گوگل که در کنار او نشسته بود، سری تکان داد و گفت: «یکی دیگر از موارد مثبت آن».
امسال، صنعت هوش مصنوعی با یک ویژگی اصلی تعریف میشود: پیشرفت بسیار سریع فناوری در حالی که پیشرفتها بر روی یکدیگر ساخته میشوند و به هوش مصنوعی اجازه میدهد انواع جدیدی از رسانهها را تولید کند، استدلال انسان را به روشهای جدید تقلید کند و به دنیای فیزیکی نفوذ کند. . از طریق ربات نسل جدید
در ماههای آینده، تولیدکنندههای تصویر مبتنی بر هوش مصنوعی مانند DALL-E و Midjourney فوراً فیلمها و همچنین تصاویر ثابت را ارائه خواهند داد. و به تدریج آنها با چت ربات هایی مانند ChatGPT ادغام خواهند شد.
این بدان معناست که چتباتها با پردازش عکسها، فیلمها، نمودارها، نمودارها و سایر رسانهها بسیار فراتر از متن دیجیتال خواهند رفت. آنها رفتاری از خود نشان خواهند داد که شباهت بیشتری به منطق انسانی دارد و با کارهای پیچیدهتر در زمینههایی مانند ریاضیات و علوم مقابله میکند. آوردن فناوری به روبات ها همچنین به حل مشکلات فراتر از دنیای دیجیتال کمک می کند.
بسیاری از این پیشرفت ها در حال حاضر در آزمایشگاه های تحقیقاتی برتر و محصولات فناوری ظهور کرده اند. با این حال، در سال 2024، قدرت این محصولات به طور قابل توجهی افزایش می یابد و توسط افراد بسیار بیشتری مورد استفاده قرار می گیرد.
دیوید لوان، مدیرعامل Adept، یک استارت آپ جدید هوش مصنوعی، گفت: «پیشرفت سریع هوش مصنوعی ادامه خواهد داشت. “این اجتناب ناپذیر است.”
OpenAI، گوگل و سایر شرکت های فناوری به دلیل نحوه ساخت سیستم های زیربنایی، هوش مصنوعی را بسیار سریعتر از سایر فناوری ها توسعه می دهند.
اکثر برنامه های نرم افزاری توسط مهندسان، یک خط کد کامپیوتری در یک زمان ایجاد می شوند، و این اغلب یک فرآیند کند و خسته کننده است. شرکتها هوش مصنوعی را سریعتر توسعه میدهند زیرا این فناوری مبتنی بر شبکههای عصبی است که سیستمهای ریاضی هستند که میتوانند مهارتها را با تجزیه و تحلیل دادههای دیجیتال بیاموزند. یک شبکه عصبی میتواند با تشخیص الگوهای موجود در دادههایی مانند مقالات ویکیپدیا، کتابها و متون دیجیتالی که از اینترنت جمعآوری شدهاند، متن تولید کند.
امسال، شرکتهای فناوری قصد دارند دادههای بیشتری از جمله تصاویر، صداها و متن بیشتری را به سیستمهای هوش مصنوعی وارد کنند که انسانها قادر به درک آن نیستند. همانطور که این سیستمها روابط بین این انواع مختلف دادهها را یاد میگیرند، یاد میگیرند مسائل پیچیدهتر را حل کنند و آنها را برای زندگی در دنیای فیزیکی آماده کنند.
(نیویورک تایمز ماه گذشته از OpenAI و مایکروسافت به دلیل نقض حق چاپ محتوای خبری مربوط به سیستم های هوش مصنوعی شکایت کرد.)
هیچ کدام از اینها به این معنی نیست که هوش مصنوعی به زودی قادر به مطابقت با مغز انسان خواهد بود. در حالی که هدف شرکتها و کارآفرینان هوش مصنوعی ایجاد چیزی است که آنها «هوش عمومی مصنوعی» مینامند – ماشینی که میتواند هر کاری را که مغز انسان میتواند انجام دهد، انجام دهد – این یک کار دلهرهآور باقی میماند. با وجود تمام دستاوردهای سریع، هوش مصنوعی هنوز در مراحل ابتدایی است.
در اینجا راهنمای چگونگی تغییر هوش مصنوعی در سال جاری است که با جدیدترین پیشرفتها شروع میشود که منجر به پیشرفتهای بیشتر در قابلیتهای آن میشود.
فیلم های فوری
تا به حال، برنامه های مبتنی بر هوش مصنوعی بیشتر متن و تصاویر ثابت را در پاسخ به درخواست ها تولید می کردند. به عنوان مثال، DALL-E میتواند با درخواستهایی مانند «یک کرگدن غواصی از پل گلدن گیت» در چند ثانیه تصاویر واقعی خلق کند.
اما امسال، شرکتهایی مانند OpenAI، Google، Meta و Runway مستقر در نیویورک نیز انتظار میرود رندرهایی را راهاندازی کنند که به مردم اجازه میدهد ویدیو بسازند. این شرکتها قبلاً نمونههای اولیه ابزارهایی را توسعه دادهاند که میتوانند فوراً از طریق پیامهای متنی کوتاه ویدیو ایجاد کنند.
شرکتهای فناوری احتمالاً با گنجاندن قدرت تولیدکنندگان تصویر و ویدیو در چتباتها، چتباتها را قدرتمندتر خواهند کرد.
رباتهای چت “چند وجهی”.
رباتهای چت و تولیدکنندههای تصویر که در ابتدا بهعنوان ابزارهای جداگانه توسعه یافته بودند، به آرامی در حال ادغام هستند. هنگامی که OpenAI نسخه جدیدی از ChatGPT را در سال گذشته منتشر کرد، ربات چت میتوانست تصاویر و همچنین متن تولید کند.
شرکت های هوش مصنوعی در حال ساخت سیستم های “چند وجهی” هستند. این بدان معناست که هوش مصنوعی می تواند بیش از یک نوع رسانه را پردازش کند. این سیستمها با تجزیه و تحلیل عکسها، متنها و بهطور بالقوه دیگر انواع رسانهها، از جمله نمودارها، نمودارها، صدا و ویدئو، مهارتها را یاد میگیرند تا بتوانند متن، تصاویر و صداهای خود را تولید کنند.
این همش نیست. از آنجایی که سیستمها روابط بین انواع مختلف رسانه را نیز یاد میگیرند، میتوانند یک نوع رسانه را درک کنند و با دیگری پاسخ دهند. به عبارت دیگر، شخصی می تواند تصویری را به چت بات ارسال کند و چت بات می تواند با متن پاسخ دهد.
احمد الداله، که رهبری گروه هوش مصنوعی مولد در متا را بر عهده دارد، گفت: «تکنولوژی هوشمندتر و مفیدتر خواهد شد. “او بیشتر انجام خواهد داد.”
درست مانند چت ربات های متنی اشتباه می کنند، چت ربات های چندوجهی هم اشتباه می کنند. شرکتهای فناوری همچنین در تلاش برای کاهش خطاها هستند زیرا سعی میکنند چتباتهایی بسازند که بتوانند مانند انسانها استدلال کنند.
“استدلال” بهتر
وقتی آقای آلتمن در مورد هوش مصنوعی صحبت میکند که یک قدم رو به جلو برداشته است، به چتباتهایی اشاره میکند که در «استدلال» بهتر عمل میکنند تا بتوانند وظایف پیچیدهتری مانند حل مسائل پیچیده ریاضی و ایجاد برنامههای کامپیوتری پیچیدهتر را انجام دهند.
هدف ایجاد سیستمهایی است که میتوانند با دقت و منطقی یک مشکل را از طریق یک سری مراحل گسسته حل کنند، که هر کدام در مرحله بعدی ساخته میشوند. مردم حداقل در برخی موارد اینگونه استدلال می کنند.
دانشمندان پیشرو در مورد اینکه آیا چت ربات ها واقعاً می توانند اینگونه استدلال کنند، اختلاف نظر دارند. برخی استدلال میکنند که این سیستمها فقط با تکرار رفتاری که در دادههای اینترنتی میبینند، استدلال میکنند. اما OpenAI و دیگران در حال توسعه سیستم هایی هستند که می توانند با اطمینان بیشتری به سؤالات پیچیده مربوط به موضوعاتی مانند ریاضیات، برنامه نویسی رایانه، فیزیک و سایر علوم پاسخ دهند.
نیک فراست، محقق سابق گوگل که به رهبری استارت آپ Cohere با هوش مصنوعی کمک می کند، می گوید: «با قابل اعتمادتر شدن سیستم ها، محبوب تر خواهند شد.
اگر چت ربات ها در استدلال بهتر باشند، می توانند به “عامل های هوش مصنوعی” تبدیل شوند.
“عوامل هوش مصنوعی”
از آنجایی که شرکتها به سیستمهای هوش مصنوعی خود آموزش میدهند تا مشکلات پیچیده را گام به گام حل کنند، میتوانند توانایی چتباتها را برای استفاده از برنامههای کاربردی نرمافزار و وبسایتها از جانب شما بهبود بخشند.
محققان اساساً چت بات ها را به نوع جدیدی از سیستم مستقل به نام عامل هوش مصنوعی تبدیل می کنند. این بدان معناست که رباتهای گفتگو میتوانند از برنامههای نرمافزاری، وبسایتها و سایر ابزارهای آنلاین از جمله صفحات گسترده، تقویمهای آنلاین و سایتهای مسافرتی استفاده کنند. سپس افراد می توانند کارهای اداری خسته کننده را به چت ربات ها بسپارند. اما این عوامل همچنین می توانند همه چیز را به طور کامل از آنها دور کنند.
چت بات ها در حال حاضر به روش های کوچک به عنوان واسطه عمل می کنند. آنها می توانند جلسات را برنامه ریزی کنند، فایل ها را سازماندهی کنند، داده ها را تجزیه و تحلیل کنند و نمودارهای میله ای ایجاد کنند. با این حال، این ابزارها ممکن است همیشه آنطور که باید کار نکنند. هنگامی که برای کارهای پیچیده تر اعمال می شود، عامل ها کاملاً تجزیه می شوند.
امسال، شرکتهای هوش مصنوعی در حال آمادهسازی برای راهاندازی عوامل قابل اعتماد بیشتری هستند. آقای لوان گفت: “شما باید بتوانید هر کار خسته کننده و پیش پا افتاده کامپیوتری را به یک مامور محول کنید.”
این ممکن است شامل ردیابی هزینهها در برنامههایی مانند QuickBooks یا ثبت روزهای تعطیلات در برنامههایی مانند Workday باشد. در دراز مدت، فراتر از نرم افزار و خدمات اینترنتی به دنیای رباتیک گسترش خواهد یافت.
ربات های باهوش تر
در گذشته، روباتها طوری برنامهریزی میشدند که یک کار را بارها و بارها انجام دهند، مثلاً جعبههایی با اندازه و شکل یکسان را جمع کنند. اما با استفاده از همان فناوری که زیربنای رباتهای چت است، محققان به روباتها قدرت میدهند تا کارهای پیچیدهتری را انجام دهند، از جمله کارهایی که قبلاً ندیدهاند.
همانطور که رباتهای چت میتوانند با تجزیه و تحلیل مقادیر زیادی از متن دیجیتالی کلمه بعدی را در یک جمله پیشبینی کنند، یک ربات نیز میتواند با تجزیه و تحلیل ویدیوهای بیشماری از اشیاء در حال ضربه زدن، بلند کردن و حرکت دادن، پیشبینی کند که در دنیای فیزیکی چه اتفاقی خواهد افتاد.
پیتر چن، محقق سابق OpenAI که این استارت آپ رباتیک را اداره می کند، می گوید: “این فناوری ها می توانند حجم عظیمی از داده ها را جذب کنند. و همانطور که داده ها را جذب می کنند، می توانند یاد بگیرند که جهان چگونه کار می کند، چگونه فیزیک کار می کند، چگونه با اشیاء تعامل می کنید.” کوواریانت.
امسال، هوش مصنوعی به روباتهایی نیرو میدهد که در پشت صحنه کار میکنند، مانند بازوهای مکانیکی تا کردن پیراهنها در خشکشویی یا دستهبندی تودهها در انبار. غول های فناوری مانند ایلان ماسک نیز در حال تلاش برای حرکت هستند ربات های انسان نما وارد خانه های مردم می شوند.