مقایسه Gemini و Claude با 7 پرامپت؛ برنده کدام است؟

به گزارش مجله مدیاپلیر، در مدت زمان کوتاهی، هوش مصنوعی از یک فناوری حاشیه ای به ابزاری تبدیل شده که هر روز به وسیله میلیون ها نفر استفاده می گردد. بخش عمده ای از این استفاده به وسیله چت بات هایی مانند Claude، Gemini و ChatGPT انجام می گردد. اگرچه ChatGPT از OpenAI بیشترین توجه را به خود جلب می نماید، اما Gemini از گوگل و Claude از Anthropic هم قابلیت ها و عملکردهای چشمگیری دارند. هرکدام از این دو هوش مصنوعی ویژگی ها و قابلیت های منحصربه فردی دارند که در چت جی پی تی یافت نمی گردد، مانند Artifacts و Gems. در این مقاله می خواهیم به مقایسه Gemini و Claude بپردازیم.

مقایسه Gemini و Claude با 7 پرامپت؛ برنده کدام است؟

ما پیشتر از این یک سری آزمایش بین چت جی پی تی و جمینای، سپس بین چت جی پی تی و کلود انجام داده بودیم که هر بار ChatGPT در آن ها برنده شده بود. اکنون تصمیم گرفتیم مقایسه Gemini و Claude را انجام دهیم تا ببینیم برنده کدام است. برای این آزمایش، 7 پرامپت طراحی کردیم. در طراحی این پرامپت ها از همان ساختاری که در مقایسه های قبلی استفاده کردیم بهره بردیم و سپس از مدل o1 OpenAI برای ایده پردازی استفاده کردیم.

طراحی پرامپت ها در مقایسه Gemini و Claude

دسته بندی های ما در اینجا شامل فراوری تصویر، تحلیل تصویر، کدنویسی و نوشتن خلاقانه است. این نوع دسته بندی به ما امکان می دهد تا طیف کاملی از قابلیت های این هوش های مصنوعی را در بیشتر موارد استفاده ای که دارند، آزمایش کنیم. از آنجا که هوش مصنوعی کلود خود توانایی فراوری تصویر ندارد، از او خواستیم تا متنی را برای یک دادن به هوش مصنوعی دیگری برای فراوری تصویر برایمان ایجاد کند. بعلاوه، ویژگی های خاصی مانند پروژه ها در Claude یا Gems در هوش مصنوعی جمینای را نادیده گرفتیم تا بتوانیم بر عملکرد مشابه هر کدام از این دو مدل هوش مصنوعی متمرکز شویم. در این مقایسه، از نوترین مدل ها یعنی Claude Sonnet 3.5 و Google Gemini 2.0 Experimental Advanced استفاده کردیم.

1. فراوری تصویر

در ابتدا در مقایسه Gemini و Claude، آنالیز می کنیم که Claude و Gemini چگونه می توانند یک متن دقیق را برای فراوری یک تصویر ارائه دهند. Gemini به مدل فراوری تصویر Imagen 3 دسترسی دارد، اما از آنجا که Claude مدل خاص خود را ندارد، از آن ها خواستم متن یک پرامپت را برایمان ایجاد نمایند تا ببینیم این دو برنامه هوش مصنوعی چگونه عمل می نمایند.

پرامپت:

یک متن پرامپت دقیق و توصیفی برای یک ابزار فراوری تصویر با AI ایجاد کن که یک صحنه مهمانی در باغی سایبرپانک و سورئال را به تصویر بکشد. تصویر فراوری شده باید شامل موارد زیر باشد: یک گلخانه نئونی در شب با گیاهان عجیب و درخشان؛ ربات های انسان نما که با انسان ها تعامل دارند و آبمیوه هایی که در آینده فراوری شده اند را به انسان ها ارائه می دهند.

تصویر باید دارای حس ظرافت خیال انگیزی باشد که طبیعت را با فناوری پیشرفته ترکیب می نماید؛ فانوس های هولوگرافیک یا گوی های شناور که فضا را زیباتر می نمایند هم باید در تصویر باشند. خروجی نهایی باید متن دقیقی باشد که در ابزار فراوری تصویر وارد گردد. مطمئن شو که این پرامپت، مواردی از قبیل سبک، نورپردازی، ترکیب بندی و هر جزئیات هنری خاص (مانند تمرکز بر رنگ های زنده، فوتورئالیسم یا جلوه نقاشی گونه) را به ما پیشنهاد دهد.

پرامپت فراوری شده به وسیله Claude:

مهمانی در باغ به سبک سایبرپانک و فوتورئالیستیک در گلخانه ای شیشه ای در شب، گل های بیولومینسانس و پیچک های نئون تابدار، ربات های انسان نمای (اندروید) شیک با لباس های رسمی که آبمیوه های رنگین کمانی را به مهمانان انسانی ارائه می دهند، فانوس های هولوگرافیک شناور که نور منشوری از خود منتشر می نمایند، سطوح کروم و شیشه ای که رنگ هایی نظیر بنفش های تیره و آبی های الکتریکی را منعکس می نمایند، مه ملایم، نورپردازی سینمایی پیشرفته، عمق میدان کم، بافت های تصویری دقیق.

پرامپت فراوری شده به وسیله Gemini:

مهمانی در باغ به سبک سایبرپانک سورئال، شب، گلخانه نئون، گیاهان عجیب و فضایی درخشان، ربات های انسان نمای شیک و انسان ها در حال تعامل، آبمیوه هایی از آینده، فضایی خیال انگیز، فانوس های هولوگرافیک شناور، گوی های درخشان و پرنور، فوتورئالیستیک، جزئیات پیچیده، نورپردازی نرم، سایه های دراماتیک، پالتی از رنگ های زنده، شات زاویه باز.

Claude با متن پرامپت زنده تر و دقیق تری که عناصر مختلف را به خوبی ترکیب نموده و سبک آینده نگرانه را به تصویر کشیده بود، برنده شد.

برنده: Claude به علت توصیفی تر و غنی تر بودن متن پرامپت

2. تحلیل تصویر

در این بخش در مقایسه Gemini و Claude قابلیت های تحلیل تصویر هر دو مدل را آنالیز کردیم. برای این آزمایش، تصویری از چیدمان کامل یک میز گیمینگ که به وسیله تونی پولانکو ارائه شده بود، در اختیار مدل ها نهاده شد. سپس از آن ها خواسته شد تا درباره ارگونومی، مدیریت کابل ها، نورپردازی و موارد دیگر نظر بدهند. دستورالعمل از این قرار بود؛

پرامپت:

یک عکس از یک میز گیمینگ پیشرفته را در نظر بگیرید و موارد زیر را در آن تحلیل کنید: ارگونومی: موقعیت مانیتور، ارتفاع آن و شرایط صندلی؛ مدیریت کابل ها: شناسایی راهکار ها و مسائل واضح؛ تنظیمات نورپردازی: آنالیز خطرات برای چشم، مقدار روشنایی و فضای کلی؛ استفاده از فضا: مقدار کارایی در استفاده از فضای میز؛ چیدمان تجهیزات: آنالیز خنک سازی و دسترسی به تجهیزات جانبی. پیشنهادات دقیق خود برای بهبود شرایط ارائه دهید، از جمله هزینه های تقریبی برای ارتقا یا لوازم پیشنهادی برای خرید.

نتایج:

Claude در هر دسته بندی اش، تحلیل های مشخصی به ما ارائه داد. پیشنهاداتش واقع گرایانه و عملی بودند و طیفی از هزینه ها را هم پوشش می دادند. Gemini نیز جزئیات کاملی ارائه داد، به ویژه درباره ارگونومی و بعلاوه تحلیلش عمیق تر بود اما کمتر ساختارمند بود.

برنده: انتخاب بین آن ها سخت بود، اما Claude به علت وضوح و تطابق بهتر با دستورالعمل ها برنده شد.

3. کدنویسی در مقایسه Gemini و Claude

همواره در این آزمایش ها یک پرامپت کدنویسی هم قرار می دهیم. برای مقایسه Gemini و Claude در کدنویسی زبان پایتون را انتخاب کردیم چون اجرای آن راحت تر است. هدف این بود که یک کد تک مرحله ای ارائه گردد که بدون تغییر دادن بتواند کار کند. در این بخش از آزمایش ما معمولاً کدی برای یک بازی را ترجیح می دهیم چون تفاوت ها در آن آسان تر دیده می شوند. دستورالعملی که باید این دو هوش مصنوعی از آن تبعیت نمایند به شرح زیر است؛

پرامپت:

یک کد پایتون کامل برای یک بازی با رابط گرافیکی بنویسید. از tkinter یا pygame بهره ببرید. بازی باید دارای ویژگی های زیر باشد: یک صفحه که در آن بازیکن با کلیدهای جهت دار یک شخصیت (یا شکل) را کنترل نمایند؛ سکه هایی که به طور تصادفی ظاهر می شوند و با جمع آوری آن ها امتیاز بازیکن افزایش می یابد؛ نمایش ساده امتیاز فعلی. شرحاتی که منطق کد را شرح می دهند را حتما اضافه کنید و مطمئن شوید که کد بدون احتیاج به کتابخانه های اضافی قابل اجرا باشد.

نتایج:

هر دو مدل بازی هایی ایجاد کردند که می توان امتیاز را در آن ها دنبال کرد، سکه ها را جمع آوری کرد و بازی را ادامه داد. با این حال، تفاوت های قابل توجهی بین Claude و Gemini وجود داشت. کد Claude رابط کاربری بهتری داشت و در حالت تاریک یا دارک مود لپ تاپ هم به خوبی کار می کرد، اما نمی توان همین موارد را درباره Gemini گفت. بازی Gemini بازی ای سرگرم نماینده تر بود چون به شکل یک بازی بی سرانجام طراحی شده بود؛ به این شکل که هر بار که یک سکه جمع می کردید، یک سکه دیگر ظاهر می شد. با این حال، انتخاب ما برای برنده این بخش Claude است چون کد او بدون احتیاج به تغییر حالت نور لپ تاپ به خوبی اجرا شد. این ویژگی ای بود که Claude در مقایسه ای که در بخش کدنویسی با چت جی پی تی برگزار کردیم، نداشت.

برنده: Claude به علت ارائه کدی کامل و آماده اجرا برنده این بخش شد.

4. نوشتن خلاقانه

نوشتن خلاقانه یکی از حوزه هایی است که مدل های هوش مصنوعی مدتی است در آن فعالیت می نمایند، اما اخیراً نوشته هایشان مجذوب کننده تر و خلاقانه تر شده اند. در این بخش از مقایسه Gemini و Claude، از این دو هوش مصنوعی خواستیم تا درباره یک صحنه علمی-تخیلی کوتاه در مریخ بنویسند که شامل دیالوگ های جالب و سرانجامی هیجان انگیز و البته تعلیق آمیز باشد. دیالوگ ها و سرانجام هیجان انگیز و تعلیق آمیز دو بخشی بودند که در قضاوت ما از خروجی ها اهمیت زیادی داشتند.

پرامپت:

یک صحنه علمی-تخیلی کوتاه و مهیج (زیر 300 کلمه) بنویسید که در آن دو فضانورد هر دو پدیده عجیبی را در مدار مریخ کشف می نمایند. یک بخش کوتاه از دیالوگ را به متنتان اضافه کنید که بتواند شگفت انگیزبودن آنچه را که کشف نموده اند، به تصویر بکشد. با یک سرانجام مهیج و تعلیق آمیز که خواننده را مشتاق ادامه داستان کند، به داستان خود سرانجام دهید.

نتایج:

Claude یک سرانجام تعلیق آمیز ارائه داد که تعلیق و هیجان را با یک سرانجام بندی شوم ترکیب کرد. دیالوگ ها طبیعی بودند، اما می توانستند تأثیرگذارتر باشند. Gemini سرانجام ضعیف تری ارائه داد و نتوانست هیجان لازم را ایجاد کند، اما دیالوگ هایش بسیار مجذوب کننده تر و انسانی تر بودند. انتخاب ما در اینجا به عنوان برنده Claude است چون سرانجام او قوی تر بود و توانست تعادل خوبی بین عناصر داستانی اکشن، توصیف و دیالوگ ایجاد کند. اگرچه دیالوگ های Gemini خلاقانه تر بودند، Claude در مجموع عملکرد بهتری داشت.

برنده: Claude برای سرانجام تعلیق آمیز بهتر.

5. توانایی حل مساله

مدل های هوش مصنوعی در حل مسأله بسیار ماهر هستند زیرا می توانند الگوها را به خوبی شبیه سازی نمایند. در اینجا در مقایسه Gemini و Claude، مشخصات یک کامپیوتر گیمینگ را به آن ها دادیم و گفتیم که یک بازی نو داریم که دچار مشکل اجرا شده است و از آن ها خواستیم که راهکاری برای این مشکل پیدا نمایند. این یک مشکل واقعی است و بسیاری از کاربران روزانه در سایت های مختلف آن را مطرح می نمایند؛ حالا بیایید ببینیم که Claude و Gemini چگونه این مشکل را حل می نمایند.

پرامپت:

من اخیراً یک کامپیوتر گیمینگ با مشخصات NVIDIA RTX 4070، پردازنده Intel Core i7، 16 گیگابایت رم و یک ترابایت SSD برای ذخیره سازی آماده نموده ام. بازی نوی که نصب نموده ام هر چند دقیقه یک بار هنگ می نماید، به ویژه در زمان بارگذاری تکسچرها. یک راهنمای عیب یابی گام به گام برای من ارائه بده که شامل موارد زیر باشد: درایورهای کارت گرافیک، تنظیمات بازی (کیفیت تکسچر، وضوح تصویر و غیره)، مسائل احتمالی دما یا خنک سازی، به روزرسانی های سیستم عامل و فرایندهای پس زمینه، هرگونه آنالیز سخت افزاری اضافی یا ارتقاهای پیشنهادی. در نهایت شرح بده چرا هر گام می تواند برای حل این مشکل مفید باشد و در صورت لزوم، هزینه های تقریبی هرکدام از ارتقاها را ذکر کن.

نتایج:

پاسخ Claude کمی فنی و پیچیده بود. دقیق بود اما جزئیات مربوط به تنظیمات بازی را چندان پوشش نداده بود. با این حال، این جزئیات دقیقاً همان چیزی بود که ممکن بود برای حل مشکل احتیاج باشد. Gemini شرحات زیادی داد و تمام بخش هایی که از او خواسته بودیم را به طور جامع پوشش داد، از جمله نصب درایورها. او پیشنهاد های عملی و واقع بینانه ای ارائه داد، اما بعضی آنالیز های پیشرفته را نادیده گرفت و به جزئیات سخت افزاری به میزان Claude نپرداخت. این رقابت تنگاتنگ و نزدیکی بین دو مدل هوش مصنوعی بود. در این بخش از مقایسه Gemini و Claude از نظر ما، Claude هدایت جامع تری ارائه داد، اما Gemini جزئیات بیشتری درباره تنظیمات بازی ارائه کرد که باعث شد برنده این بخش باشد.

برنده: Gemini به علت ارائه جزئیات بیشتر در خصوص تنظیمات بازی

6. توانایی برنامه ریزی در مقایسه Gemini و Claude

مدل های هوش مصنوعی در برنامه ریزی بسیار خوب عمل می نمایند. ما در این بخش از مقایسه Gemini و Claude تصمیم گرفتیم ببینیم هر یک از این دو هوش مصنوعی، چگونه می توانند آشپزخانه و اتاق نشیمن یک آپارتمان را به فضایی دل باز تبدیل نمایند؛ همانطوری که اگر از طراحان داخلی خواسته گردد، این پلان را طراحی می نمایند. از این دو هوش مصنوعی خواستیم که نمونه هایی از طراحی ها و سبک ها، مجوزهای لازم، نکات هماهنگی و هزینه های تقریبی را ارائه دهند.

پرامپت:

من می خواهم آشپزخانه و اتاق نشیمنم را به یک فضای دل باز تبدیل کنم. یک برنامه مفصل ارائه دهید که شامل موارد زیر باشد: بودجه بندی: تخمین هزینه ها برای تخریب یک دیوار غیر باربر، کف سازی نو و نورپردازی، مشاوره طراحی: چه زمانی باید یک طراح داخلی را درگیر کرد، نمونه هایی از سبک های ممکن، مجوزها و مقررات: چه مجوزها یا بازرسی هایی ممکن است احتیاج باشد، زمان بندی و پیمانکاران: چگونه باید معاملات مختلف را هماهنگ نموده و یک زمان بندی واقع بینانه را مدیریت کرد، شرایط زندگی: نکاتی برای کنار آمدن با ساخت وساز در حال اجرا در خانه.

پس از انجام این ها، در دو یا سه جمله، یک پرامپت برای یک هوش مصنوعی مولد تصویر ارائه دهید تا تصویری از فضای آشپزخانه-اتاق نشیمن دلبازی که درخواست داده بودیم و حالا تکمیل شده، بسازد؛ تصویری که باید عناصر طراحی اصلی که با مشاوره شما انجام گرفته است را در خود داشته باشد.

نتایج:

Claude با یک پاسخ ساختارمند و بودجه بندی واقع بینانه، و یک طرح عملی حتی در زمان ساخت، عمل کرد. Gemini جزئیات بیشتری در هر بخش ارائه داد، از جمله تنوع سبک ها و توجه به احتیاج به مجوزها. در این مرحله انتخاب ما Gemini است چون پیشنهادات بیشتری از نظر طراحی داشت و به خوبی ایده های مختلف را آنالیز کرد.

برنده: Gemini به علت گزینه های بیشتر

7. آموزش

ممکن است شما هم با موضوعی مثل کامپیوترهای کوانتومی روبرو شده باشید و درک آن را سخت یافته باشید؛ هنوز بسیاری وجود دارند که با فهمیدن مفاهیم آن مشکل دارند. بنابراین در این مرحله از مقایسه Gemini و Claude از هر دو مدل خواستیم که مفاهیم این فناوری را به زبانی ساده شرح دهند و از تشبیهات استفاده نمایند تا آن را برای خواننده قابل درک تر نمایند.

پرامپت:

تفاوت های کامپیوترهای کوانتومی با کامپیوترهای کلاسیک را با استفاده از مثال ها یا تشبیهات ساده شرح دهید و حتما موارد زیر را پوشش دهید: کیوبیت ها در مقابل بیت ها، سوپراپوزیشن کوانتومی و معنای آن، کاربردهای آن در دنیای واقعی (حال و آینده)، محدودیت های سخت افزاری فعلی و مقیاس پذیری آن، چرا محاسبات کوانتومی برای آینده فناوری مهم هستند. از مثال ها یا تشبیهات ساده ای بهره ببرید که هر کسی بتواند آن ها را درک کند.

نتایج:

معیارهای ما برای اعلام برنده این مرحله شامل وضوح و سادگی، تشبیهات دقیق و قابل درک، پاسخ جامع و جوابی است که ما را در نهایت درگیر خود کند. Claude تشبیه های روشنی از سوپراپوزیشن به عنوان یک کتابخانه و یک سکه در حال چرخش برای تجسم بیت ها و کیوبیت ها ارائه داد. بعلاوه از مثال هایی در زمینه کشف دارو و بعلاوه بهینه سازی ترافیک برای شرح بیشتر استفاده کرد. با این حال، مثال های او محدود بودند و بیشتر بر روی حوزه های حرفه ای متمرکز بودند و تأثیر AI در این حوزه نادیده گرفته شده بود.

Gemini از مثال یک سوئیچ دیمری یا همان کلید قابل تنظیم برای مقایسه بیت ها با کیوبیت ها استفاده کرد که تشبیه ملموس تری است. بعلاوه از سکه در حال چرخش برای سوپراپوزیشن استفاده کرد و کاربردهای دنیای واقعی AI و لجستیک را هم برایمان ذکر کرد. این پاسخ کمی طولانی و البته تکراری بود. برای ما Claude برنده بود چون پاسخ آن مستقیم تر و برای خوانندگان غیر فنی قابل فهم تر بود. Gemini تشبیهات غنی تری ارائه داد، اما پاسخ Claude برای مخاطب عمومی قابل درک تر بود.

برنده: Claude برای پاسخ قابل درک تر

در نگاه اول ممکن است به نظر برسد که Claude برنده ای قاطع در این چالش بوده است، اما Gemini در آزمایش های متعدد ما بسیار نزدیک به Claude عمل نموده است و این چالش می توانست نتیجه ای نزدیک تر داشته باشد. ناگفته نماند که در چندین مورد انتخاب ما کمی شخصی بود و این به معنی پیروزی قاطعانه از سوی Claude نبود. در این آزمایش ما از نسخه آزمایشی پیشرفته Gemini 2.0 استفاده کردیم که هنوز در حال تست است و تنها چند هفته است که در دسترس نهاده شده است. سپس آن را در مقابل نسخه Claude Sonnet 3.5 قرار دادیم که به تدریج در ماه های گذشته بهبود یافته است.

منبع: tomsguide.com

منبع: دیجیکالا مگ
انتشار: 22 بهمن 1403 بروزرسانی: 22 بهمن 1403 گردآورنده: midya0.ir شناسه مطلب: 1921

به "مقایسه Gemini و Claude با 7 پرامپت؛ برنده کدام است؟" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "مقایسه Gemini و Claude با 7 پرامپت؛ برنده کدام است؟"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید