Claude Opus 4.7: ما الجديد وكيف يُقارَن بـ Opus 4.6

أصدرت شركة Anthropic للتو نموذج Claude Opus 4.7 — أحدث نماذجها وأكثرها قدرة المتاحة للعموم. إذا كنت تستخدم Opus 4.6 للبرمجة أو البحث أو بناء منتجات تعتمد على الذكاء الاصطناعي، فإليك كل ما تغير وما تعنيه القدرات الجديدة عمليًا.

لمحة سريعة عن المواصفات الرئيسية

المواصفات (Spec)	Opus 4.7	Opus 4.6
التسعير (Pricing)	$5 / M input, $25 / M output	$5 / M input, $25 / M output
سياق الأوامر (Context window)	1M tokens (حوالي 555 ألف كلمة)	200K tokens
أقصى طول للمخرجات (Max output)	128K tokens	64K tokens
آخر تحديث للمعرفة (Knowledge cutoff)	يناير 2026	أغسطس 2025
نمط التفكير (Thinking mode)	Adaptive Thinking	Extended Thinking
معرّف النموذج في الـ API (API model ID)	`claude-opus-4-7`	`claude-opus-4-6-20260205`
التوافر (Availability)	API, Bedrock, Vertex AI, Foundry	API, Bedrock, Vertex AI

نفس السعر، سياق أكبر، ضعف طول المخرجات، وخمسة أشهر من المعرفة الأحدث. نظريًا، يبدو أنه ترقية مباشرة. دعنا نتعمق في التحسينات الفعلية التي طرأت على النموذج.

1. البرمجة الموجهة (Agentic Coding): التحسين الأبرز

هذا هو المجال الذي يتألق فيه Opus 4.7 بشكل واضح. تصفه Anthropic بأنه "تحسين ملحوظ في هندسة البرمجيات المتقدمة، مع مكاسب خاصة في أصعب المهام".

ماذا يعني ذلك بشكل ملموس؟ ثلاثة أشياء:

التحقق الذاتي (Self-verification). لا يكتفي Opus 4.7 بكتابة الكود وتسليمه — بل يبتكر طرقًا للتحقق من مخرجاته قبل الإعلان عن اكتمال المهمة. إذا سبق لك أن واجهت وكيل ذكاء اصطناعي يقول "تم!" بينما الكود لا يعمل فعليًا، فأنت تعرف أهمية ذلك.

الاتساق في المهام طويلة الأمد (Long-running task consistency). يتعامل النموذج مع المهام المعقدة متعددة الخطوات "بصرامة واتساق". كانت النماذج السابقة تميل إلى فقدان الترابط في الجلسات الطويلة. Opus 4.7 يبقى على المسار الصحيح.

الالتزام الصارم بالتعليمات (Strict instruction following). يولي "اهتمامًا دقيقًا بالتعليمات" — مما يعني حالات أقل يتجاهل فيها النموذج قيودك أو يخرج عن الموضوع.

أرقام المقاييس المعيارية (Benchmark)

مكاسب الأداء ليست هامشية. عبر مقاييس البرمجة الواقعية من كبرى شركات الذكاء الاصطناعي، يظهر Opus 4.7 تحسينات تفوق 10% ويحل مشاكل كانت في السابق بعيدة المنال:

CursorBench: نسبة حل 70% (مقابل 58% لـ Opus 4.6) — قفزة بمقدار 12 نقطة. يصفه Cursor بأنه "قفزة ذات مغزى في القدرات، لا سيما في استقلاليته وتفكيره الأكثر إبداعًا."
مقياس البرمجة ذو 93 مهمة من Augment: زيادة بنسبة 13% في الحلول مقارنة بـ Opus 4.6، بما في ذلك 4 مهام لم يتمكن أي من Opus 4.6 أو Sonnet 4.6 من حلها. بالإضافة إلى زمن استجابة (latency) متوسط أسرع والتزام صارم بالتعليمات.
Notion Agent: تحسن بنسبة 14% عن Opus 4.6 باستخدام عدد أقل من tokens وثلث أخطاء الأدوات (tool errors). "أول نموذج يجتاز اختبارات الحاجة الضمنية لدينا، ويواصل التنفيذ رغم فشل الأدوات الذي كان يوقف Opus سابقًا."
Rakuten-SWE-Bench: حل مهام إنتاجية أكثر بثلاث مرات من Opus 4.6، مع مكاسب تفوق 10% في جودة الكود (Code Quality) وجودة الاختبار (Test Quality).
Warp Terminal Bench: اجتاز مهام فشلت فيها نماذج Claude السابقة، بما في ذلك خطأ مزامن (concurrency bug) صعب لم يتمكن Opus 4.6 من حله.
مراجعة الكود في CodeRabbit: تحسن معدل الاستدعاء (Recall) بأكثر من 10%، مما كشف عن أخطاء صعبة الاكتشاف في طلبات الدمج (PRs) المعقدة مع الحفاظ على استقرار الدقة (precision). "أسرع قليلاً من GPT-5.4 xhigh على منصتنا (harness)."
Genspark Super Agent: أعلى نسبة جودة لكل استدعاء أداة (quality-per-tool-call ratio) تم قياسها. أفضل مقاومة للتكرار الحلقي (loop resistance) (النموذج الذي يتكرر إلى ما لا نهاية في 1 من كل 18 استعلامًا يهدر الحوسبة ويحجب المستخدمين)، وأقل تباين (variance)، وأفضل استرداد للأخطاء.

هذه ليست مقاييس معيارية مصطنعة — إنها أعباء عمل إنتاجية من شركات تقدم منتجات حقيقية. النمط متسق: Opus 4.7 ينجز المزيد من العمل، ويرتكب أخطاء أقل، ويتعافى بشكل أفضل عند حدوث مشاكل.

2. الرؤية (Vision): فهم الصور بدقة أعلى

يمتلك Opus 4.7 "قدرات رؤية أفضل بكثير" مع دعم الصور عالية الدقة. هذا لا يعني فقط رؤية الصور بشكل أوضح — بل يفتح حالات استخدام عملية:

Solve Intelligence أفادت بـ "تحسينات كبيرة في الفهم متعدد الوسائط (multimodal understanding)، من قراءة الهياكل الكيميائية (chemical structures) إلى تفسير المخططات التقنية المعقدة (technical diagrams)". إنهم يستخدمونه في سير عمل براءات الاختراع في علوم الحياة بما في ذلك الصياغة (drafting)، والمتابعة (prosecution)، وكشف الانتهاك (infringement detection)، ورسم مخططات الإبطال (invalidity charting).
للمطورين الذين يبنون أدوات تعالج لقطات الشاشة (screenshots)، أو المخططات (diagrams)، أو نماذج واجهة المستخدم (UI mockups)، تعني الدقة الأعلى قراءة خاطئة أقل للعناوين، وفهمًا أفضل للتخطيط، وقدرات شبيهة بالـ OCR أكثر دقة.

3. المخرجات الإبداعية والاحترافية

تقول Anthropic إن Opus 4.7 "أكثر ذوقًا وإبداعًا عند إكمال المهام الاحترافية، وينتج واجهات وشرائح ومستندات عالية الجودة."

يأتي التأييد الأكثر حماسًا من أحد المختبرين الذي وصفه بأنه "أفضل نموذج في العالم لبناء لوحات المعلومات (dashboards) والواجهات الغنية بالبيانات (data-rich interfaces). الذوق التصميمي مدهش حقًا — يتخذ خيارات كنت سأعتمدها بالفعل. لقد أصبح خياري الافتراضي اليومي الآن."

إذا كنت تستخدم Claude لإنشاء مكونات واجهة المستخدم (UI components)، أو عروض الشرائح (slide decks)، أو تخطيطات المستندات (document layouts)، فهذا تحسين كبير في جودة الحياة.

4. التفكير التكيفي (Adaptive Thinking) (يحل محل Extended Thinking)

استخدم Opus 4.6 نمط التفكير الموسع (Extended Thinking) — وهو وضع يعرض فيه النموذج سلسلة تفكيره بشكل صريح. ينتقل Opus 4.7 إلى التفكير التكيفي (Adaptive Thinking)، الذي يضبط عمق التفكير تلقائيًا بناءً على تعقيد المهمة.

الفرق العملي: لست بحاجة إلى التبديل يدويًا بين أنماط التفكير. يقرر النموذج مقدار التفكير الذي تحتاجه المهمة ويخصص الموارد وفقًا لذلك. تحصل الأسئلة البسيطة على إجابات سريعة؛ والمشاكل المعقدة تحصل على تحليل أعمق.

ملاحظة: لا يزال Sonnet 4.6 يدعم Extended Thinking. إذا كنت تحتاج تحديدًا إلى سلاسل تفكير مرئية، يظل Sonnet هو الخيار.

5. سياق الأوامر (Context Window): أكبر 5 مرات، وTokenizer جديد

القفزة من 200K إلى 1M tokens هائلة على الورق. هذا يعادل حوالي 555,000 كلمة — وهو ما يكفي لاستيعاب قواعد أكواد كاملة، أو مجموعات مستندات طويلة، أو سجلات محادثات ممتدة.

ومع ذلك، هناك تفصيل مهم: يستخدم Opus 4.7 tokenizer جديد. ينتج نفس النص عددًا أكبر من tokens مما كان عليه الحال مع tokenizer الخاص بـ Opus 4.6. تشير Anthropic إلى أن سياق الـ 1M يتوافق مع ما يقرب من 555 ألف كلمة، مقارنةً بـ 750 ألف كلمة لكل مليون token مع الـ tokenizer القديم. عمليًا، الموجه الذي كان يكلفك 1,000 tokens مع Opus 4.6 قد يكلف الآن حوالي 1,300 tokens مع Opus 4.7. لم يتغير سعر الـ token الواحد، لكن تكلفتك الفعلية لكل محادثة ترتفع بنسبة 30% تقريبًا. يستحق الأمر أخذه في الحسبان في ميزانيتك إذا كنت من مستخدمي الـ API بكثافة.

ماذا يعني هذا عمليًا:

ستستهلك موجهاتك عدد tokens أكبر من ذي قبل
"السعة النصية" الفعلية لسياق الـ 1M تعادل تقريبًا ~740K tokens على الـ tokenizer القديم
لا يزال ترقية كبيرة من 200K في Opus 4.6، ولكن من الجيد أن تكون على دراية به لتقدير التكلفة

6. أقصى طول للمخرجات (Max Output): تضاعف إلى 128 ألف

كان الحد الأقصى للمخرجات في Opus 4.6 هو 64K tokens. يضاعف Opus 4.7 ذلك إلى 128K. هذا مهم لـ:

إنشاء مستندات أو تقارير طويلة في دفعة واحدة
توليد أكواد معقدة تمتد عبر ملفات متعددة
مهام التحليل التفصيلية حيث كان على النموذج سابقًا اقتطاع استجابته

بالنسبة لسير العمل الموجه (agentic workflows) حيث يحتاج النموذج إلى إنتاج تغييرات واسعة (diffs) أو تغييرات متعددة الملفات، فإن مخرجات بحجم 128K تعد تحسينًا عمليًا.

7. مشروع Glasswing وضمانات الأمان السيبراني

Opus 4.7 هو أول نموذج يتم إصداره في إطار Project Glasswing من Anthropic. في الأسبوع الماضي، سلطت Anthropic الضوء على كل من المخاطر والفوائد لنماذج الذكاء الاصطناعي في مجال الأمن السيبراني (cybersecurity)، والتزمت باختبار ضمانات جديدة على نماذج أقل قدرة قبل إطلاق نموذجها الأقوى، Claude Mythos Preview، على نطاق واسع.

ماذا يعني هذا بالنسبة لـ Opus 4.7:

قدرات سيبرانية مخفضة: أثناء التدريب، "جربت Anthropic جهودًا لتقليل القدرات في مجال الأمن السيبراني بشكل تفاضلي" مقارنة بـ Mythos Preview.
ضمانات تلقائية: يتضمن النموذج كشفًا مدمجًا يمنع الطلبات التي تشير إلى "استخدامات محظورة أو عالية الخطورة في مجال الأمن السيبراني."
برنامج التحقق السيبراني (Cyber Verification Program): يمكن لمحترفي الأمن الذين يقومون بعمل مشروع (بحث عن الثغرات، pentesting، red-teaming) التقدم بطلب للحصول على الوصول عبر برنامج التحقق السيبراني.

هذا هو أول اختبار حقيقي لـ Anthropic لضوابط القدرة التفاضلية — أي جعل نموذج أقل قدرة عمدًا في مجالات محددة مع تحسينه في مجالات أخرى. ما سيتعلمونه من نشر Opus 4.7 سيشكل كيفية (ومتى) سيطلقون نماذج من فئة Mythos على نطاق أوسع.

8. التوافر والتكامل

Opus 4.7 متاح عبر جميع المنصات الرئيسية منذ اليوم الأول:

Claude API — وصول مباشر عبر claude-opus-4-7
Amazon Bedrock — anthropic.claude-opus-4-7 (معاينة للبحث)
Google Cloud Vertex AI — claude-opus-4-7
Microsoft Foundry — إضافة منصة جديدة

إضافة Microsoft Foundry ملحوظة — إنها المرة الأولى التي يتوفر فيها نموذج Claude Opus على منصة Microsoft عند الإطلاق.

ماذا يقول المختبرون الأوائل

بعيدًا عن أرقام المقاييس، تكشف التعليقات النوعية من مختبري الشركات عن مواضيع متسقة:

عن الموثوقية:

Hex: "أقوى نموذج قامت Hex بتقييمه. يبلغ بشكل صحيح عند فقدان البيانات بدلاً من تقديم بدائل معقولة ولكن غير صحيحة، ويقاوم فخاخ البيانات المتنافرة التي يقع فيها حتى Opus 4.6."
Devin: "يأخذ الاستقلالية طويلة المدى (long-horizon autonomy) إلى مستوى جديد. يعمل بشكل متماسك لساعات، ويشق طريقه عبر المشاكل الصعبة بدلاً من الاستسلام."

عن الكفاءة:

Replit: "قرار ترقية سهل. نفس الجودة بتكلفة أقل — أكثر كفاءة ودقة في مهام مثل تحليل السجلات والآثار، وإيجاد الأخطاء، واقتراح الإصلاحات."
Hex: "Opus 4.7 بجهد منخفض يعادل تقريبًا Opus 4.6 بجهد متوسط." — مما يعني أنك تحصل على نفس جودة المخرجات بجهد أقل في هندسة الموجهات (prompt engineering).

عن التفكير المنطقي:

Harvey (الذكاء الاصطناعي القانوني): "دقة موضوعية بنسبة 90.9% على BigLaw Bench بجهد عالٍ مع معايرة أفضل للتفكير. يميز بشكل صحيح بين أحكام التنازل (assignment provisions) وأحكام تغيير السيطرة (change-of-control provisions)، وهي مهمة شكلت تحديًا تاريخيًا للنماذج الرائدة."
Quantium: "أكبر المكاسب ظهرت حيث تهم أكثر: عمق التفكير (reasoning depth)، وتأطير المشكلات بشكل منظم (structured problem-framing)، والعمل التقني المعقد."

عن الشخصية:

Replit: "أحب كيف أنه يعارض أثناء المناقشات الفنية لمساعدتي في اتخاذ قرارات أفضل. يبدو حقًا كزميل عمل أفضل."
وصف Anthropic الخاص: يطرح النموذج "منظورًا أكثر حزمًا، بدلاً من مجرد الموافقة على رأي المستخدم."

9. من يستخدمه بالفعل — وماذا يبنون

قائمة المختبرين الأوائل تبدو كقائمة "من هم" في أدوات المطورين التي تعمل بالذكاء الاصطناعي. إليك نظرة سريعة على كيفية استخدام الشركات المختلفة لـ Opus 4.7:

وكلاء البرمجة وبيئات التطوير المتكاملة (IDEs): تدمج كل من Cursor، و Replit، و Warp، و Devin نموذج Opus 4.7 كنموذجها الأساسي أو الأعلى مستوى لمهام البرمجة المستقلة. تشير Devin تحديدًا إلى "الاستقلالية طويلة المدى" (long-horizon autonomy) — حيث يعمل النموذج بشكل متماسك لساعات في أعمال التحقيق العميقة التي لم تكن ممكنة بشكل موثوق من قبل.

مراجعة الكود (Code review): تستعد CodeRabbit لاستخدام Opus 4.7 في "أثقل أعمال المراجعة عند الإطلاق"، مشيرة إلى تحسن بنسبة 10%+ في معدل الاستدعاء (recall) للأخطاء صعبة الاكتشاف في طلبات الدمج المعقدة (complex pull requests).

منصات الذكاء الاصطناعي للمؤسسات: شهدت Hebbia قفزات تفوق 10% في دقة استدعاء الأدوات (tool call accuracy) والتخطيط للوكلاء المنسقين (orchestrator agents) الذين يتعاملون مع الاسترجاع (retrieval)، وإنشاء الشرائح، وتوليد المستندات. تفيد Genspark بأعلى نسبة جودة لكل استدعاء أداة (quality-per-tool-call ratio) قاموا بقياسها عبر أي نموذج.

القانون والمالية: تفيد Harvey بدقة موضوعية بنسبة 90.9% على BigLaw Bench. تصفه Hex بأنه "أقوى نموذج قامت Hex بتقييمه" — يبلغ بشكل صحيح عن البيانات المفقودة بدلاً من اختلاق بدائل معقولة، ويقاوم فخاخ البيانات التي وقع فيها حتى Opus 4.6. يصفه مختبر في مجال التكنولوجيا المالية بأنه يكتشف "أخطاءه المنطقية الخاصة خلال مرحلة التخطيط."

علوم الحياة: تستخدم Solve Intelligence قدرات الرؤية (vision) المحسنة في سير عمل براءات الاختراع (patent workflows) — قراءة الهياكل الكيميائية (chemical structures)، وتفسير المخططات التقنية، والتعامل مع كل شيء من الصياغة إلى كشف الانتهاك.

تصور البيانات: وصفه أحد المختبرين بأنه "أفضل نموذج في العالم لبناء لوحات المعلومات (dashboards) والواجهات الغنية بالبيانات (data-rich interfaces)،" مشيرًا إلى أن "الذوق التصميمي مدهش حقًا — يتخذ خيارات كنت سأعتمدها بالفعل."

اتساع نطاق الاعتماد ملحوظ. هذا ليس مجرد نموذج للبرمجة — إنه يُنشر عبر مجالات القانون والمالية وعلوم الحياة وأتمتة المؤسسات. القاسم المشترك: المهام التي تتطلب تفكيرًا مستمرًا، واستخدامًا دقيقًا للأدوات، ومخرجات موثوقة على مدى جلسات طويلة.

ملخص المقارنة: Opus 4.7 مقابل Opus 4.6

القدرة	Opus 4.6	Opus 4.7	التغيير
Agentic coding	قوي	أقوى بكثير	+12-14% على المقاييس الرئيسية
Self-verification	محدود	مدمج	قدرة جديدة
Vision	قياسي	دقة أعلى	تحسن كبير
Creative output	جيد	"أكثر ذوقًا"	تحسين في الجودة
Context window	200K	1M	أكبر 5 مرات
Max output	64K	128K	أكبر مرتين
Thinking mode	Extended	Adaptive	عمق يتكيف تلقائيًا
Knowledge cutoff	أغسطس 2025	يناير 2026	أحدث بـ 5 أشهر
Tool error recovery	يتوقف عند الفشل	يواصل العمل	مكسب كبير في الموثوقية
Cyber safeguards	لا يوجد	Project Glasswing	إطار أمان جديد
Pricing	$5/$25 لكل مليون tokens	$5/$25 لكل مليون tokens	لم يتغير

الخلاصة

Claude Opus 4.7 هو ترقية مركزة تضاعف من قوة Opus فيما كان جيدًا فيه بالفعل — أعمال البرمجة المعقدة والمستقلة — مع إضافة تحسينات ذات مغزى على الرؤية وطول المخرجات وسعة السياق.

أكبر المكاسب تكمن في موثوقية الوكيل (agentic reliability): التحقق الذاتي (self-verification)، والتعافي من أخطاء الأدوات (tool error recovery)، واتساق المهام طويلة الأمد (long-running task consistency). إذا كنت تبني أدوات تطوير تعمل بالذكاء الاصطناعي أو تستخدم Claude Code في أعمال البرمجة اليومية، فإن هذه التحسينات تترجم مباشرة إلى مهام فاشلة أقل ومراقبة أقل.

يستحق tokenizer الجديد وضمانات الأمان السيبراني في Project Glasswing الفهم، حيث يؤثران على كل من حسابات التكلفة وسلوك النموذج في المهام المتعلقة بالأمن.

بالنسبة للمطورين الذين يستخدمون Opus 4.6 بالفعل، فإن مسار الترقية بسيط — استبدل claude-opus-4-6 بـ claude-opus-4-7 في استدعاءات الـ API الخاصة بك. نفس السعر، قدرة أكبر.

روابط:

إعلان Anthropic: anthropic.com/research/claude-opus-4-7
وثائق الـ API: platform.claude.com/docs
مشروع Glasswing: anthropic.com/glasswing
برنامج التحقق السيبراني: claude.com/form/cyber-use-case

Claude Opus 4.7: ما الجديد وكيف يقارن بـ Opus 4.6