أبحاث الذكاء الاصطناعي لشركة آبل: هذه هي استراتيجيتهم

  • يجمع Apple Intelligence بين النماذج الموجودة على الجهاز والنماذج السحابية الخاصة مع التدقيق والتشفير.
  • تكتسب Siri السياق والكتابة والإجراءات في التطبيقات؛ ويتم تحسين الكتابة والصور والصور باستخدام الذكاء الاصطناعي.
  • التكامل الاختياري مع ChatGPT (GPT-4o) مع حماية الخصوصية وعنوان IP المخفي.
  • تكشف دراسات شركة آبل عن وجود قيود في التفكير النموذجي والتقدم في دمج المستشعرات.

أبحاث الذكاء الاصطناعي لشركة آبل

بذلت شركة آبل قصارى جهدها لدمج الذكاء الاصطناعي في أجهزتها دون المساس بميزتها المميزة: الخصوصية. في السنوات الأخيرة، طرحت الشركة سلسلة من التطورات بدءًا من النماذج التي تعمل على الجهاز نفسه حتى أن هناك سحابة خاصة مصممة خصيصًا لحماية بياناتك، بالإضافة إلى نشر دراسات تتساءل عن حدود التفكير في أحدث النماذج.

بعيدًا عن العناوين الرئيسية، يُسمى الابتكار الحقيقي "ذكاء أبل": طبقة ذكاء اصطناعي شخصية ذات قدرات توليدية، وفهم سياقي، وإجراءات داخل التطبيق. تتكامل هذه الطبقة مع أجهزة iPhone وiPad وMac، وتجمع بين المعالجة المحلية وبنية تحتية مخصصة للخوادم. الوعد واضح: فائدة حقيقية في الحياة اليومية، مع أقل قدر ممكن من التعرض لمعلوماتك.

الخصوصية والهندسة المعمارية: Apple Intelligence والحوسبة السحابية الخاصة

هندسة Apple Intelligence والخصوصية

يعتمد الأساس التقني الجوهري لـ Apple Intelligence على فكرة بسيطة: أي شيء يمكن تشغيله على جهاز iPhone أو iPad أو Mac الخاص بك، يعمل هناك. النماذج الموجودة على الجهاز نفسه إنهم يتعاملون مع العديد من مهام اللغة والصور دون مغادرة جهاز الكمبيوتر الخاص بك، مما يقلل من مخاطر التعرض من الجذر.

عندما يتطلب الطلب سعة أكبر، يأتي دور الحوسبة السحابية الخاصة (PCC)، وهي عبارة عن سحابة خادم مع شرائح M4 وM4 Max يختلف تصميم أمان Apple اختلافًا كبيرًا عن المعتاد. قبل اتصال الجهاز بالسحابة، يتحقق PCC تشفيريًا تُصرّح شركة Apple بأن برنامج الخادم متاحٌ للعامة للفحص، مما يسمح لخبراء مستقلين بمراجعته. كما تُصرّح الشركة بأن البيانات لا تُخزّن ولا تُشارك.

يتيح هذا الهيكل الهجين إمكانية التوسع بين نماذج الأجهزة والنماذج الأكبر حجمًا القائمة على الخادم. ووفقًا لشركة Apple نفسها، فإن نماذجها الأساسية محلية. يساوي أو يتجاوز المكافئات الصغيرة من الشركات المصنعة الأخرى، في حين أن نماذج الخادم أعلى من GPT-3 وأداءها حول GPT-4، مع التحكم في الخصوصية كأولوية دائمًا.

باختصار، تسعى Apple Intelligence إلى فهم سياقك الشخصي لتكون مفيدة، لكنها تفعل ذلك من خلال الحواجز التقنية والتنظيمية التي تحاول ضمان ذلك ستبقى معلوماتك مغلقة. سواء على الجهاز أو في السحابة الخاصة.

اللغة والإنتاجية: اكتب بشكل أفضل، اقرأ أقل

أدوات الكتابة والإنتاجية في Apple Intelligence

قدمت Apple أدوات تحرير مدمجة في أنظمة iOS وiPadOS وmacOS لمساعدتك على إعادة كتابة النصوص ومراجعتها وتلخيصها في تطبيقات مثل البريد والملاحظات والصفحات وتطبيقات الجهات الخارجية. يمكنك طلب تعديل درجة اللون. قواعد اللغة البولندية والمفردات أو تحويل كتلة من النص إلى نقاط أو جداول أو ملخصات قصيرة.

في البريد، ستجد الرسائل ذات الأولوية، وهو قسم يضع الرسائل العاجلة في المقدمة (دعوة اليوم، بطاقة صعود الطائرة، إلخ). بالإضافة إلى ذلك، قد تعرض قائمة البريد الإلكتروني الملخصات المُولَّدة بدلاً من الأسطر القليلة الأولى، تكتشف الإجابات الذكية الأسئلة المعلقة بحيث لا يبقى شيء دون إجابة.

أصبحت الإشعارات أكثر ذكاءً. تُبرز الإشعارات ذات الأولوية الرسائل المهمة في المقدمة، وتُلخص المحادثات الطويلة جدًا على شاشة القفل. مع وضع تقليل المقاطعات، يسمح النظام بمرور رسائل محددة فقط. ما يتطلب اهتماما فورياالمساعدة في الحفاظ على التركيز عند الحاجة.

تتضمن الملاحظات والهاتف الآن التسجيل مع النسخ والملخص. عند تسجيل مكالمة، يتم إشعار جميع المشاركين تلقائيًا، وعند إنهاء المكالمة، يُنشئ Apple Intelligence ملخصًا للنقاط الرئيسية. إنها طريقة سهلة لـ محادثات الوثيقة بدون عمل إضافي.

الإبداع: ملعب الصور وجينموجي

للجوانب البصرية، يتضمن Apple Intelligence بيئة Image Playground لإنشاء الصور في ثوانٍ معدودة بأنماط مثل الرسوم المتحركة والرسوم التوضيحية والرسم التخطيطي. تعمل هذه البيئة ضمن تطبيق الرسائل، وتتضمن... تطبيق مستقل للتجربة بلا حدود، حيث يتم إجراء التوليد على الجهاز.

يتم توجيه سير العمل: اختر الأفكار حسب الفئة (الموضوعات، المواقع، الإكسسوارات، الأزياء)، وصف ما تبحث عنه، أو حتى اختيار شخص من مكتبة صورك لضمه إلى المشروع. في الرسائل، يقترح النظام أفكارًا. متعلق بالمحادثة حتى يتناسب ما تنشئه مع السياق.

في تطبيق الملاحظات، تُحوّل أداة Image Wand في قلم Apple Pencil الرسومات إلى صور بنقرة واحدة، بل وتستخدم سياق الصفحة لملء الفراغات. بالإضافة إلى ذلك، تتيح واجهة برمجة تطبيقات Image Playground للجهات الخارجية دمج هذه الإمكانيات في تطبيقات مثل Keynote وFreeform وPages.

يتقدم التعبير خطوةً أخرى مع جينموجي: اكتب وصفًا، وسيُنشئ النظام رمزك التعبيري الخاص، مع خيار استلهامه من وجه شخص ما من صورك. يمكنك استخدامه كملصقات أو ردود فعل (Tapback) أو إدراجه عبر الإنترنت، مما يُتيح لك أسلوب تواصل فريدًا. أكثر شخصية.

الصور الذكية وعمليات البحث الطبيعية

يتلقى تطبيق الصور تحسينات تُركز على التحكم وسرعة العثور على ما تبحث عنه. يمكنك إجراء عمليات بحث باللغة الطبيعية مثل "لورا تتزلج مع" تي شيرت مطبوع"أو "سارة مع الملصقات على وجهها"، وفي الفيديو، انتقل مباشرة إلى اللحظة ذات الصلة.

أداة التنظيف الجديدة تكتشف عناصر الخلفية غير المرغوب فيها وتزيلها دون التأثير على الموضوع الرئيسي. إنها طريقة ذكية لإزالة المشتتات دون استخدام أدوات معقدة، مع الحفاظ على واقعية الالتقاط.

تُنشئ الذكريات قصصًا من وصف مكتوب. يختار Apple Intelligence أفضل الصور ومقاطع الفيديو، ويُنظم السرد في فصول، ويقترح أغاني Apple Music التي تُناسب الحالة المزاجية. تتم هذه العملية بأكملها باستخدام العلاج الخاص على الجهاز.

الهدف ليس فقط العثور على الأشياء بشكل أسرع، ولكن أيضًا تحويل مكتبتك تلقائيًا إلى قصص ذات معنى، حيث يفهم النظام ما يحدث في الصور ومتى حدث ذلك لبناء تجربة أكثر عاطفية.

سيري: أكثر قدرة، وأكثر سياقية، وأكثر كتابةً أيضًا

تم تجديد سيري من الداخل والخارج. تم تحسين فهمه للغة الطبيعية، ويمكنه متابعة أفكارك حتى لو صححت نفسك بسرعة، ويراعي السياق عند تقديم الطلبات. يمكنك أيضًا التبديل بين الصوت والنص حسب الحاجة؛ وبصريًا، هناك توهج جديد حول الشاشة. يشير إلى متى يكون نشطًا.

يفهم المساعد ما يظهر على الشاشة ويتفاعل مع محتوى التطبيقات الأخرى. إذا تلقيت عنوان شخص ما عبر الرسائل، فما عليك سوى طلب "إضافة هذا العنوان إلى بطاقته" وسيتولى Siri الباقي. كما يمكنه تنفيذ إجراءات معقدة مثل "إرسال صور حفل شواء السبت إلى..." ماري» دون الحاجة إلى فتح أي شيء.

ميزة جديدة أخرى هي دورها كدليل مستخدم للجهاز: تُجيب سيري على آلاف أسئلة "كيف أفعل...؟" حول أجهزة iPhone أو iPad أو Mac، بدءًا من جدولة رسالة بريد إلكتروني في Mail ووصولًا إلى تفعيل الوضع المُظلم. وبفضل Apple Intelligence، تُصبح استباقية عند الاتصال. البيانات الشخصية والسياق"تشغيل البودكاست الذي أوصى به جايمي" أو "متى تهبط أمي؟" هي أمثلة على الطلبات التي تم حلها دون الحاجة إلى تذكر مكان المعلومات.

الأمر المهم هو أن الذكاء الاصطناعي يصل إلى السياق الضروري لمساعدتك، ولكن مع الوعد بالخصوصية: تتم معالجة معظمها على الجهاز نفسه، وعندما يتم توسيعه إلى سحابة Apple، فإنه يفعل ذلك بموجب الضمانات الفنية للحوسبة السحابية الخاصة، والتي تحد من تعرض البيانات.

ChatGPT داخل النظام البيئي: كيف ومتى وبأي حدود

تُدمج Apple إمكانية الوصول إلى ChatGPT في تجارب النظام: يمكن لـ Siri مراجعة النموذج عند الحاجة، مع طلب إذنك دائمًا قبل إرسال الطلب (والمرفقات مثل الصور أو المستندات). تصل الردود دون مغادرة التدفق من iOS أو iPadOS أو macOS.

تُؤخذ الخصوصية أيضًا في الاعتبار: عناوين IP مخفية، ولا يحفظ OpenAI الطلبات افتراضيًا. عند ربط حساب ChatGPT الخاص بك، تُطبق سياساته، ويمكنك الوصول إلى الميزات المدفوعة من داخل النظام. يستخدم التكامل GPT‑4o، مع إمكانية الوصول المجاني دون إنشاء حساب.

علاوة على ذلك، تتيح لك أدوات الكتابة من Apple استخدام ChatGPT لإنشاء الصور والنصوص وقتما تشاء. وقد تركت Apple الباب مفتوحًا لدمج نماذج أخرى (مثل Gemini) في المستقبل، وتوقعت بالفعل أنه إذا كان نظام الذكاء الاصطناعي الخاص بها لا أستطيع التعامل مع شيء ماسيقترح عليك استخدام نموذج تابع لجهة خارجية بشكل اختياري.

التوفر والأجهزة المتوافقة

Apple Intelligence مجاني ومتوفر بنسخة تجريبية لأنظمة iOS 18 وiPadOS 18 وmacOS Sequoia. بدأ طرحه باللغة الإنجليزية (الولايات المتحدة) وتوسّع تدريجيًا. وصلت العديد من الميزات إلى أجهزة iPhone مع iOS 18.4، وبدأ طرحه في إسبانيا في أبريل 2025. الاسبانية، لا يزال في مرحلة تجريبية.

متطلبات الأجهزة: iPhone 15 Pro و15 Pro Max، بالإضافة إلى iPad وMac بمعالج M1 أو أحدث. بالنسبة لبعض الميزات الأولية، كان لا بد من ضبط Siri ولغة الجهاز. الإنجليزية (الولايات المتحدة)في نظامي Mac وiPad، يبدأ التوافق مع Apple Silicon.

  • أجهزة Mac المتوافقة: MacBook Air (M1، 2020) أو أحدث؛ MacBook Pro (M1، 2020) أو أحدث؛ Mac mini (M1، 2020) أو أحدث؛ Mac Studio (M1 Max/Ultra، 2022) أو أحدث؛ iMac (M1، 2021) أو أحدث؛ Mac Pro (M2 Ultra، 2023).
  • أجهزة iPad المتوافقة: iPad Air (الجيل الخامس) أو الأحدث؛ iPad Pro (الجيل السادس) أو لاحقا.
  • أجهزة iPhone المتوافقة: iPhone 15 Pro و15 Pro Max؛ عائلة iPhone 16 (بما في ذلك 16 و16 Plus و16e و16 Pro و16 Pro Max).

يرجع هذا التخفيض إلى متطلبات الذاكرة والحوسبة للنماذج الموجودة على الجهاز، وهو ما يفسر سبب لا تنتشر إلى أجهزة iPhone السابقة لـ A17 Pro.

قسم البحث والتطوير في Apple: دمج أجهزة الاستشعار مع برنامج LLM لفهم ما تفعله

نشرت شركة آبل دراسةً توضح كيفية دمج بيانات المستشعرات، مثل الصوت والحركة، للتعرف على الأنشطة اليومية (الطبخ، الغسيل، ممارسة الرياضة) دون الحاجة إلى تدريب نموذج محدد لكل مهمة. يكمن السر في «الاندماج المتأخر"أولاً، تقوم النماذج الصغيرة بمعالجة كل إشارة على حدة وتوليد أوصاف/ملصقات نصية؛ ثم تقوم نماذج LLM الأكبر بدمج هذه الملخصات لتحديد ما يحدث."

هذه النتيجة مهمة لأنها تعمل حتى مع الإشارات المشوشة، وتُقلل الحاجة إلى بناء نماذج مخصصة لكل سيناريو. كما أنها إيجابية للخصوصية: لا يتقبل برنامج ماجستير الحقوق الصوت الخام، بل الأوصاف النصية في نظام Apple، قد يؤدي هذا إلى اكتشاف تمارين رياضية أكثر دقة على Apple Watch أو التعرف على النشاط على iPhone مع استهلاك أقل للطاقة.

التحدي، كما هو الحال دائمًا، هو طرحه في السوق. على الرغم من أن أبل تنشر أبحاثًا أكثر من ذي قبل، يرى البعض في المجتمع أن الشركة بحاجة إلى ترجمة هذه التطورات إلى ميزات مرئية بسرعة أكبر، وهو مجال حيث التوقعات عالية.

ماذا تخبرنا شركة أبل عن الأسباب وراء هذه النماذج؟

يقوم مسار بحثي آخر في شركة آبل بتحليل نماذج التفكير المتخصصة (LRMs) وإخضاعها لألغاز كلاسيكية مثل برج هانوي، وعبور الأنهار، والقفز على البلاط، مما يزيد من تعقيدها تدريجيًا. والنتيجة واضحة: تتجاوز الدقة حدًا معينًا. ينهار إلى الصفرحتى لو تمت إضافة المزيد من قوة الحوسبة.

لاحظ الباحثون ثلاثة أنظمة: عند التعقيد المنخفض، كان أداء نماذج LLM التقليدية أفضل وأكثر كفاءة؛ وعند التعقيد المتوسط، كانت نماذج LRM الأفضلية؛ وعند التعقيد العالي، انهار كلاهما. علاوة على ذلك، مع اقترابها من العتبة الحرجة، كانت النماذج مفاجئة. إنهم يقللون من جهدهم (عدد أقل من "رموز الفكر") حتى لو كانت المشكلة أكثر صعوبة.

يكشف تحليل "آثار الاستدلال" عن سلوكين: في المسائل البسيطة، تجد النماذج الحل لكنها تستمر في استكشاف مسارات خاطئة ("التفكير المفرط")؛ وفي المسائل متوسطة التعقيد، تُجرّب العديد من المسارات الخاطئة قبل العثور على المسار الصحيح؛ وفي المسائل عالية التعقيد، لا تظهر الحالات الوسيطة الصحيحة. حتى مع تزويد النماذج بالخوارزمية خطوة بخطوة، إنهم يستمرون في الفشل إذا تجاوز التعقيد حده.

الهشاشة في الرياضيات في المرحلة الابتدائية: GSM8K والمتغيرات الرمزية

قامت شركة Apple أيضًا بتقييم برامج ماجستير القانون العامة - بما في ذلك GPT-4o وo1-mini وo1-preview، بالإضافة إلى Llama3-8B وPhi-3 وGemma2-9B وMathstral-7B - في مهام الرياضيات على مستوى المدرسة (GSM8K). باستخدام مجموعة اختبارات جديدة (GSM-Symbolic) تُولّد متغيرات مُتحكّم فيها، لوحظ أن التغييرات البسيطة في الأسماء أو معلومات غير ذات صلة يمكنهم تدمير الدقة.

عندما تُقدّم التغذية الراجعة تدريجيًا، يتحسن الأداء، لكن التغييرات الطفيفة في القيم أو بنية العبارة تؤدي إلى انخفاضات كبيرة. النتيجة مُقلقة: غالبًا ما تُحاكي النماذج الأنماط المُلاحظة أثناء التدريب بدلًا من التفكير المنطقي، مما يُترجم إلى... عدم الاستقرار في مواجهة الاضطرابات يبدو غير مؤذٍ.

أدوات المطور: Xcode والنماذج الأساسية

لمطوري التطبيقات، طرحت Apple نماذج أساسية للتطبيقات على الجهاز والخادم، مع التركيز على محولات متخصصة لمهام مثل التلخيص أو تعديل النغمة. ووفقًا لتقييم داخلي، تتفوق النماذج على الجهاز أو تُضاهي نظيراتها الصغيرة من جهات خارجية، بينما تتفوق النماذج على جانب الخادم... تفوق على GPT-3 وتظل تقريبًا عند مستوى GPT-4.

يُقدّم Xcode 16 ميزة إكمال الأكواد التنبؤية على الجهاز، مدعومةً بنموذج مُدرّب خصيصًا على Swift وواجهات برمجة تطبيقات Apple. يتطلب جهاز Mac مزودًا بذاكرة وصول عشوائي (RAM) لا تقل عن 16 جيجابايت. بالإضافة إلى ذلك، تُنشئ Swift Assist، وهي ميزة دردشة تستخدم نماذج سحابية، الرسائل وتُعدّلها وتُشرحها. رمز السرعة داخل IDE.

الفريق والموهبة: هكذا تجري شركة Apple الأبحاث

تحتفظ شركة Apple بفرق متعددة للأبحاث والمنتجات في مجال الذكاء الاصطناعي: بدءًا من البنية الأساسية للتعلم الآلي (الحوسبة والبيانات والتخزين على نطاق واسع) إلى الخبراء في التعلم العميق والتعزيزيمع مسارات بحثية تشمل التعلم المُشرف وغير المُشرف، والنماذج التوليدية، والتعلم متعدد الوسائط، ونظرية القرار. كما يعملون على معدات معالجة اللغة الطبيعية وتقنيات الكلام.

مجال رئيسي آخر هو معالجة اللغة الطبيعية وتقنيات الكلام: الترجمة الآلية، والتعرف على الكيانات، والإجابة على الأسئلة، وتجزئة المواضيع، وتحويل النص إلى كلام، والتعرف الآلي على الكلام. يتضمن ذلك العمل مع كميات كبيرة من البيانات. أساليب التعلم العميق لدعم لغات متعددة وحالات استخدام واقعية. بالإضافة إلى ذلك، كانت هناك تحركات موهوبة مثل استحوذت شركة ميتا على رئيس قسم الذكاء الاصطناعي في شركة آبل.

الاستراتيجية والخطوات التالية

في مؤتمر WWDC 2025، أكدت Apple أن الذكاء الاصطناعي لم يعد مجرد إضافة، بل أصبح جوهر النظام البيئي. مع A18 Pro وM4 و رقاقة M5يتم تعزيز بعض عمليات المعالجة على الجهاز، ويتم تنفيذ وظائف مثل ترجمة المكالمات في الوقت الفعليملخصات تلقائية و"ذكاء بصري" لتحديد العناصر في الصور ومقاطع الفيديو توضح اتجاه المنتج.

تجمع الشركة بين التزامها بتطوير ذكاء اصطناعي خاص بها وتكاملات اختيارية مع جهات خارجية (مثل ChatGPT)، وهو موقف يتماشى مع تركيزها على الخصوصية والتحكم في تجربة المستخدم. في الوقت نفسه، ظهرت مفاوضات للاستحواذ على Perplexity AI، وهو محرك بحث تفاعلي، وفقًا لمصادر. في حال إتمام هذه المفاوضات، فقد تُحسّن Siri. تعزيز سفاري وتقديم بديل أصلي لجوجل ضمن النظام البيئي، بما يتماشى مع الشفافية في النتائج.

مع نشر Apple Intelligence كخدمة مجانية على الأجهزة المتوافقة، تتضمن خريطة الطريق توسيع دعم اللغة، وتعزيز ضمانات الحوسبة السحابية الخاصة، وتحويل البحث - من دمج المستشعرات إلى تقييم التفكير - إلى تحسينات ملموسة على أنظمة iOS وiPadOS وmacOS.

لقد دشنت آبل عصرًا يتكامل فيه الذكاء الاصطناعي والخصوصية وتصميم المنتجات: معالجة على الجهاز كلما أمكن، وسحابة خاصة قابلة للتدقيق للمهام المعقدة، وأدوات كتابة وإبداع متكاملة، وسيري أكثر فائدة ووعيًا بالسياق، وأبحاث تساعد على فهم الإمكانات والقيود الحالية للنماذج. كل هذا يرسم صورة لنهج رصين وعملي، حيث التكنولوجيا يصبح غير مرئي لذلك فإن ما تفعله به هو ما يهم.

أداء Apple Silicon M4 Max
المادة ذات الصلة:
أداء Apple Silicon M4 Max: الاختبارات والذكاء الاصطناعي والمقارنة