نصائح مفيدة

شبكات لأجهزة الكمبيوتر العملاقة

Pin
Send
Share
Send
Send


الحوسبة الموزعة هي إحدى الطرق للمساهمة في بعض المشاريع المثيرة للاهتمام. عندما يكون الكمبيوتر خاملاً ، قم بمشاركة طاقته مع مشروع SETI ، الذي يبحث عن حضارات خارج كوكب الأرض. في هذه الحالة ، سيقوم جهاز الكمبيوتر الخاص بك بتحليل بيانات الأقمار الصناعية والمعلومات الواردة من التلسكوبات.

ستساعدك هذه المقالة على الانضمام إلى المشاريع (مثل SETI) التي تتضمن الحوسبة الموزعة. توفر لك المقالة أيضًا BOINC ، وهو برنامج حوسبة موزع.

أنت بحاجة إلى جهاز كمبيوتر. إذا كان لديك بالفعل واحدة ، فانتقل إلى قسم المصادر والارتباطات وقم بتثبيت برنامج BOINC. إذا لم تكن مهتمًا بمشروع SETI ، ستجد أدناه قائمة بالمشروعات الأخرى.

إذا كان هناك الكثير من المال

بشكل منفصل ، نلاحظ خط المعالجات باهظ الثمن ولكنه إنتاجي على مقبس Intel Xeon LGA1567.
أعلى معالج في هذه السلسلة هو E7-8870 مع عشرة النوى 2.4 جيجا هرتز. سعره هو 4616 دولار. لمثل وحدات المعالجة المركزية ، وإفراج HP و Supermicro! بثمانى! هيكل الخادم. تدعم ثمانية معالجات Xeon E7-8870 بسرعة 10 جيجا هرتز مزودة بمعالج HyperThreading 8 مؤشرات ترابط 8 * 10 * 2 = 160 ، والتي يتم عرضها في إدارة مهام Windows كمائة وستين رسمًا بيانيًا لتحميل المعالج ، المصفوفة 10x16.

من أجل تركيب ثمانية معالجات في العلبة ، لا يتم وضعها على الفور على اللوحة الأم ، ولكن على لوحات منفصلة تلتصق باللوحة الأم. تُظهر الصورة أربع لوحات رئيسية مزودة بمعالجات مثبتة في اللوحة الأم (اثنتان على كل منهما). هذا هو الحل سوبرمايكرو. في حل HP ، يكون لكل معالج لوحة خاصة به. تبلغ تكلفة حل HP ما بين مليونين وثلاثة ملايين ، وهذا يتوقف على عدد المعالجات والذاكرة وغير ذلك. تكاليف الهيكل Supermicro 10،000 دولار ، وهو أكثر جاذبية. بالإضافة إلى ذلك ، يمكن لـ Supermicro وضع أربع بطاقات توسيع للمعالجات في منافذ PCI-Express x16 (بالمناسبة ، لا يزال هناك مجال لمحول Infiniband لتجميع مجموعة من هذه) ، ولكن اثنين فقط في HP. وبالتالي ، لإنشاء حاسوب عملاق ، منصة ثمانية المعالج من Supermicro هي أكثر جاذبية. تُظهر الصورة التالية من المعرض الحاسوب العملاق الكامل مع أربع لوحات GPU.

ومع ذلك ، أنها مكلفة للغاية.

شبكات الاتصالات

يتم تحديد فعالية الحاسوب العملاق في العديد من التطبيقات إلى حد كبير من خلال ملف تعريف العمل مع الذاكرة والشبكة. عادة ما يتم وصف ملف تعريف العمل مع الذاكرة من خلال التعريب المكاني الزماني للمكالمات - حسب حجم المكالمات ومبعثر عناوينها ، ويتم وصف ملف تعريف العمل مع الشبكة من خلال توزيع العقد التي يتم تبادل الرسائل معها ، وسعر الصرف وأحجام الرسائل.

إن أداء حاسوب عملاق في المهام ذات التبادل المكثف للبيانات بين العقد (مشاكل النمذجة ، مشاكل الرسوم البيانية والشبكات غير المنتظمة ، العمليات الحسابية باستخدام المصفوفات المتناثرة) يتم تحديده بشكل أساسي من خلال أداء الشبكة ، وبالتالي فإن استخدام الحلول التجارية التقليدية (على سبيل المثال ، شبكة جيجابت إيثرنت) غير فعال للغاية. ومع ذلك ، تعد الشبكة الحقيقية دائمًا حلاً وسطًا ، حيث يتم تحديد الأولويات بين السعر والأداء واستهلاك الطاقة والمتطلبات الأخرى التي تتعارض إلى حد كبير: يمكن أن تؤدي محاولات تحسين إحدى الخصائص إلى تدهور الآخر.

تتكون شبكة الاتصال من عقد ، كل منها يحتوي على محول شبكة متصل بجهاز توجيه واحد أو أكثر ، والذي يرتبط بدوره عبر قنوات اتصال عالية السرعة (ارتباطات).

التين. 1. طوبولوجيا 4D-torus (3x3x3x3)

يتم تحديد بنية الشبكة ، التي تحدد مدى ارتباط العقد بدقة بين النظام ، من خلال طوبولوجيا الشبكة (عادةً شعرية أو تورس أو شجرة سميكة) ومجموعة من المعلمات الهيكلية: عدد القياسات وعدد مستويات الأشجار وأبعاد جوانب تورس وعدد المفاتيح في مستويات الشجرة وعدد المفاتيح الموجودة في مستويات الشجرة وعدد المفاتيح المنافذ على أجهزة التوجيه ، إلخ. يوضح الشكل 1 مثالًا لطوبولوجيا طورق ثلاثي الأبعاد 3x3x3x3.

تحدد بنية جهاز التوجيه بنية ووظيفة الكتل المسؤولة عن نقل البيانات بين عقد الشبكة ، وكذلك الخصائص الضرورية لبروتوكولات القناة وشبكة طبقات النقل ، بما في ذلك خوارزميات التحكم في التدفق وتدفق البيانات. تحدد بنية محول الشبكة هيكل ووظائف الكتل المسؤولة عن التفاعل بين المعالج والذاكرة والشبكة ، على وجه الخصوص ، يتم دعم عمليات MPI على هذا المستوى ، RDMA (الوصول المباشر للذاكرة عن بعد - الوصول المباشر إلى ذاكرة عقدة أخرى دون مشاركة المعالج الخاص بها) ، تأكيدات الاستلام بواسطة عقدة أخرى من الحزمة ، والتعامل مع الحالات الاستثنائية ، وتجميع الحزم.

لتقييم أداء شبكة الاتصالات ، غالبًا ما يتم استخدام ثلاث خصائص: قدرة (مقدار البيانات المنقولة لكل وحدة زمنية) ، تأخير الاتصال (وقت نقل البيانات عبر الشبكة) ، سرعة الرسالة (عادة ، يفكرون بشكل منفصل في معدل التسليم عند إرسال واستقبال وإرسال الحزم بين الوحدات الداخلية لجهاز التوجيه).

للتأكد من اكتمالها ، يتم قياس هذه الخصائص على أنواع مختلفة من حركة المرور ، على سبيل المثال ، عندما تقوم إحدى العقدة بإرسال البيانات إلى جميع الآخرين ، أو على العكس من ذلك ، فإن جميع العقد ترسل البيانات إلى واحدة ، أو عندما ترسل جميع العقد بيانات إلى وجهات عشوائية. يتم فرض متطلبات الوظيفة على الشبكات الحديثة:

  • التنفيذ الفعال لمكتبة Shmem ، كخيار لدعم نموذج الاتصال أحادي الاتجاه ، و GASNet ، الذي يستند إليه تنفيذ العديد من لغات PGAS ،
  • التنفيذ الفعال لـ MPI (عادة ما يتطلب ذلك دعمًا فعالًا لآلية المخازن المؤقتة للحلقات وإشعارات الحزم المستلمة) ،
  • دعم فعال للعمليات الجماعية: البث (إرسال نفس البيانات في وقت واحد إلى العديد من العقد) ، والتقليل (تطبيق عملية ثنائية ، على سبيل المثال ، إضافة إلى مجموعة القيم المستلمة من عقد مختلفة) ، وتوزيع عناصر الصفيف على مجموعة العقد (الانتثار) ، وتجميع مجموعة من العناصر ، تقع في العقد المختلفة (جمع) ،
  • دعم فعال لعمليات تزامن العقدة (على الأقل مزامنة الحاجز) ، والتفاعل الفعال مع شبكة من عدد كبير من العمليات على العقدة ، وضمان تسليم حزم موثوق.

من المهم أيضًا توفير الدعم الفعال لعمل المهايئ مع ذاكرة المضيف مباشرةً دون مشاركة المعالج.

الشبكات الخارجية عالية السرعة

يمكن تقسيم جميع شبكات الاتصالات إلى فئتين: تجاري ومخصص ، يتم تطويرهما كجزء من أنظمة الكمبيوتر ومتاح فقط معهما. بين الشبكات التجارية ، ينقسم السوق بين InfiniBand و Ethernet - في قائمة Top500 (يونيو 2011) ، 42 ٪ من الأنظمة تستخدم InfiniBand و 45 ٪ تستخدم Gigabit Ethernet. في الوقت نفسه ، إذا ركزت InfiniBand على شريحة من الأنظمة عالية الأداء المصممة لمهام الحوسبة المعقدة مع عدد كبير من الاتصالات ، فإن Ethernet تشغل تقليديًا مكانًا يكون فيه تبادل البيانات بين العقد غير مهم. في الحواسيب الفائقة ، غالبًا ما تستخدم شبكة الإيثرنت ، نظرًا لانخفاض كلفتها وتوافرها ، كشبكة مساعدة إضافية من أجل الحد من تداخل حركة التحكم في المرور وحركة المهام.

ركزت شبكة Inifiniband في البداية على التكوينات باستخدام طوبولوجيا شجرة الشجرة ، ولكن أحدث الإصدارات من المحولات وأجهزة التوجيه (المصنعة بشكل أساسي من قِبل QLogic) تدعم طوبولوجيا Torus متعددة الأبعاد (باستخدام محرك توجيه Torus-2QoS) ، بالإضافة إلى طوبولوجيا هجينة من torus ثلاثي الأبعاد وشجرة الدهون. يعد حاسوب Sandia RedSky العملاق ، الذي تم تجميعه في بداية عام 2010 والآن في المركز السادس عشر في Top500 ، أحد أوائل المشاريع واسعة النطاق مع شبكة InfiniBand وطوبولوجيا ثلاثية الأبعاد ثلاثية الأبعاد (6 × 6 × 8). أيضًا ، يتم توجيه الكثير من الاهتمام إلى الدعم الفعال لعمليات RDMA ومكتبة Shmem (على وجه الخصوص ، Qlogic Shmem).

ترجع شعبية InfiniBand إلى نظامها الإيكولوجي المتطور منخفض التكلفة نسبيًا ودعمًا فعالًا لـ MPI. ومع ذلك ، لدى InfiniBand عيوبه: معدل تسليم الرسائل منخفض (40 مليون رسالة في الثانية في أحدث الحلول من Mellanox) ، انخفاض كفاءة نقل الحزم القصيرة ، تأخير كبير نسبيًا (أكثر من 1.5 fors لعقدة الإرسال إلى العقدة و 0.1- إضافي 0.5 μs لكل عقدة عبور) ، دعم ضعيف لطوبولوجيا حلقية. بشكل عام ، يمكن القول أن InfiniBand هو منتج للمستخدم الشامل ، وخلال تطويره تم التوصل إلى حل وسط بين الكفاءة والتنوع.

يمكننا أيضًا أن نلاحظ شبكة Extoll ، التي يتم إعدادها لإطلاقها في السوق - تطوير جامعة هايدلبرغ بقيادة الأستاذ أولريش بروينينغ. ينصب التركيز الرئيسي في تطوير هذه الشبكة على تقليل حالات التأخير وزيادة معدل التسليم في الاتصالات أحادية الاتجاه. من المخطط أن يكون لـ Extoll طوبولوجيا torus ثلاثية الأبعاد ويستخدم روابط بصرية بعرض نطاق يبلغ 10 جيجابت / ثانية لكل خط (قناة إرسال البيانات التسلسلية داخل الرابط) وعرض 12 حارة لكل رابط. يوجد الآن نماذج أولية لشبكة Extoll على FPGA: R1 - استنادًا إلى Virtex4 و R2 Ventoux - تصميم ثنائي العقدين يعتمد على Virtex6. النطاق الترددي أحادي الاتجاه لكل رابط هو 600 ميجابايت / ثانية (بالنسبة إلى R1). كما سيتم دعم واجهتين (HyperTransport 3.0 و PCI Express gen3) مع معالج ، مما سيتيح دمج هذه الشبكة في منصات Intel و AMD. يدعم Extoll عدة طرق لتنظيم السجلات أحادية الاتجاه ، وحدة MMU الخاصة به (وحدة إدارة الذاكرة ، مجموعة من ترجمة العناوين الافتراضية إلى عناوين فعلية) والعمليات الذرية.

على عكس الشبكات التجارية ، تحتل الشبكات المخصصة حصة سوقية أصغر بكثير ، ومع ذلك فهي تستخدم في أجهزة الكمبيوتر العملاقة الأقوى من Cray و IBM و SGI و Fujitsu و NEC و Bull. عند تصميم شبكات مخصصة ، يتمتع المطورون بمزيد من الحرية ويحاولون استخدام أساليب أكثر تقدمًا بسبب انخفاض أهمية جاذبية السوق للمنتج النهائي ، مما يحل بشكل أساسي مشكلة الحصول على أقصى أداء في فئة محددة من المهام.

يستخدم الكمبيوتر العملاق K Computer شبكة اتصال من Tofu (TOrus FUsion) ، وهي عبارة عن torus ثلاثي الأبعاد قابل للتحجيم يحتوي عقده على مجموعات من 12 عقدة (يتم توصيل مجموعات العقد بـ 12 شبكة باستخدام torus ثلاثي الأبعاد ، ولكل عقدة من هذه المجموعة ناتجها الخاص شبكة تورس ثلاثية الأبعاد). ترتبط العقد داخل كل مجموعة من خلال torus ثلاثي الأبعاد مع جوانب 2x3x4 بدون روابط مكررة ، وهو ما يعادل torus 2D مع الجانبين 3x4 (حتى نحصل على torus 5D مع بعدين ثابت). وبالتالي ، تحتوي عقدة شبكة Tofu على 10 روابط بسعة اتجاه واحد تبلغ 40 جيجابت / ثانية لكل منها. يتم دعم تزامن الحاجز للعقد والحد (عدد صحيح ونقطة عائمة) في الأجهزة.

كانت الأهداف الرئيسية في تطوير الكمبيوتر العملاق Tianhe-1A هي تحقيق كفاءة عالية في استخدام الطاقة ، لتطوير معالج وشبكة خاصة بهما متفوقة على InfiniBand QDR. يتكون الكمبيوتر العملاق من 7168 عقدة حاسوبية متصلة بشبكة القوس بتصميمها الخاص مع طوبولوجيا الأشجار السميكة. تم بناء الشبكة من أجهزة التوجيه ذات 16 منفذًا ، وعرض النطاق الترددي للرابط أحادي الاتجاه - 8 جيجابايت / ثانية ، والتأخير - 1.57 μs. عمليات RDMA المدعومة والعمليات الجماعية الأمثل.

الممثلون الكلاسيكيون للأنظمة التي تستخدم طوبولوجيا حلقية للجمع بين العقد الحسابية هي أنظمة لسلسلة IBM Blue Gene ، في الجيلين الأولين منها - Blue Gene / L (2004) و Blue Gene / P (2007) - استخدم طوبولوجيا torus ثلاثية الأبعاد. تتمتع الشبكة في Blue Gene / P بروابط ضعيفة نسبيًا مع نطاق ترددي أحادي الجانب يبلغ 0.425 جيجابايت / ثانية ، وهو أقل من عرض النطاق الترددي لوصلة InfiniBand QDR المعاصرة ، ومع ذلك ، فإن الدعم القائم على الأجهزة لمزامنة الحاجز والعمليات الجماعية (على شبكات تشبه الأشجار المنفصلة) يتيح إمكانية جيدة للتوسعة تطبيقات حقيقية. بالإضافة إلى ذلك ، يتم دمج جميع الواجهات ووحدات التوجيه في المعالجات الدقيقة BPC (Blue Gene / P Chip) ، مما يقلل بشكل كبير من تأخير إرسال الرسائل. تمتلك شبكة الاتصالات من الجيل التالي Blue Gene / Q طوبولوجيا 5D-tor ، وعلى عكس سابقاتها ، ليس لديها شبكات منفصلة لمزامنة الحواجز والعمليات الجماعية. أصبحت شريحة Blue Gene / Q لأول مرة متعددة النواة - أربعة خيوط أجهزة لكل نواة مع 16 مركزًا ، مما يسمح بإضعاف متطلبات الشبكة وضمان تحمل التأخير. تمت زيادة سرعة نقل الرابط إلى 2 جيجابايت / ثانية ، ولكن لا يزال صغيراً مقارنةً بـ Cray Gemini أو Extoll. يتم تدوين الإنتاجية المنخفضة في هذه الأنظمة من خلال البعد الكبير لل torus (عدد كبير من الارتباطات) ، ونتيجةً لذلك ، يكون القطر الصغير للشبكة (أصغر كثيرًا من الشبكات التي لها طوبولوجيا torus ثلاثية الأبعاد مع نفس عدد العقد). تشير المصادر المتاحة إلى إنشاء اثنين من أجهزة الكمبيوتر العملاقة من طراز Blue Gene / Q transpetaflops: سكويا مع أداء 20 PFLOPS و Mira - 10 PFLOPS. يمكننا أن نستنتج أن Blue Gene / Q يركز على المهام التي ستستخدم عشرات ومئات الآلاف من عقد الحوسبة مع حركة مرور الشبكة من النوع "الكل إلى الكل".

تمسكا آخر بالطريقة المتبعة في بناء شبكات الاتصالات باستخدام طوبولوجيا حلقية ، هو Cray ، الذي يستمر في استخدام طوبولوجيا Tor ثلاثية الأبعاد ، مع زيادة الإنتاجية وعدد الروابط التي تربط العقد المجاورة. الجيل الحالي من شبكة حلقية كراي هو شبكة كراي الجوزاء. يناظر جهاز توجيه Gemini واحدًا من أجهزة التوجيه من الجيل SeaStar2 + السابق ، أي في الواقع عقدتي شبكة ، وبالتالي في Gemini بدلاً من 6 ارتباطات 10 تستخدم للاتصال بالعقد المجاورة (يعمل 2 على توصيل محوّلين ببعضهما البعض).

غالبًا ما تكون مكونات الشبكة (محولات الشبكة ، والمفاتيح ، وأجهزة التوجيه) الخاصة بشبكة الكمبيوتر العملاق ، على عكس المعالجات ، أغلى ثمناً ، والوصول إليها محدود. على سبيل المثال ، يتم الآن إنتاج رموز التبديل الخاصة بشبكة InfiniBand ، وهي الشبكة التجارية الرئيسية لأجهزة الكمبيوتر العملاقة ، من قبل شركتين فقط ، يتم التحكم في كل منهما من قبل الولايات المتحدة. هذا يعني أنه في ظل عدم وجود تطورات خاصة بهم في مجال الشبكات عالية السرعة ، يمكن بسهولة إنشاء أجهزة كمبيوتر عملاقة حديثة في أي بلد باستثناء الولايات المتحدة الأمريكية أو الصين أو اليابان.

الشبكات المحلية

يتم تنفيذ تطوير شبكات الاتصالات لاستخدامها في أجهزة الكمبيوتر العملاقة من قبل عدد من المنظمات المحلية: RFNC VNIIEF (توجد معلومات قليلة جدًا عن هذه التطورات في المصادر المفتوحة) ، ومعهد أنظمة البرمجيات التابع للأكاديمية الروسية للعلوم ، و RSK SKIF ، و IPM RAS ، و Research Institute Kvant (شبكة MVS-Express) ").

تم تصميم شبكة اتصالات tor ثلاثية الأبعاد للكمبيوتر العملاق الروسي- SKIF-Aurora بالكامل باستخدام Altera Stratix IV FPGA ، والذي يوضح النطاق الترددي الصغير لكل رابط - 1.25 جيجابايت / ثانية (موارد FPGA محدودة للغاية).

في شبكة MVS-Express ، يتم استخدام PCI Express 2.0 لدمج عقد الحوسبة ، ويتم توصيل العقد من خلال محولات 24 منفذًا. الشبكة لديها طوبولوجيا قريبة من شجرة الدهون. يحتوي محول الشبكة في عقدة الحوسبة على منفذ واحد بعرض 4 حارات ، ونتيجة لذلك يبلغ الحد الأقصى لصرف الذروة أحادية الاتجاه لكل رابط 20 جيجابت / ثانية دون الأخذ في الاعتبار الحمل الترميز. تتمثل ميزة استخدام PCI Express في MVS-Express في الدعم الفعال للذاكرة المشتركة مع إمكانية الاتصالات أحادية الاتجاه. ونتيجة لذلك ، فإن الشبكة ملائمة لتنفيذ مكتبة Shmem ولغات PGAS (UPC ، CAF).

بدعم من وزارة الصناعة والتجارة في الاتحاد الروسي ، تعمل NICEVT OJSC على تطوير شبكة اتصالات Angara باستخدام طوبولوجيا 4D-tor ، والتي يمكن أن تصبح الأساس لإنشاء تكنولوجيات محلية لتطوير أجهزة الكمبيوتر العملاقة.

شبكة "انجارا"

الأهداف الرئيسية لتطوير شبكة أنجارا:

  • دعم فعال للاتصالات أحادية الاتجاه (طرح / الحصول) ولغات PGAS (كوسيلة رئيسية للبرمجة الموازية) ،
  • دعم MPI الفعال
  • إصدار بلورة خاصة (لتحقيق معدلات نقل عالية للبيانات وتأخيرات منخفضة) ،
  • انتقال الحزمة الآمنة المتكيفة
  • العمل الفعال مع المعالجات الحديثة والشرائح.

في المرحلة الأولى من تطوير هذه الشبكة (2006) ، تم تنفيذ محاكاة لمختلف خيارات الشبكة واتخذت القرارات الرئيسية بشأن الهيكل ، بنية التوجيه ، خوارزميات التوجيه والتحكيم. بالإضافة إلى طوبولوجيا حلقية ، تم النظر في شبكات كايلي و "شجرة سميكة". تم اختيار الطور رباعي الأبعاد نظرًا لتوجيهه الأبسط وقابلية تطويره الجيدة واتصاله العالي مقارنةً بالطوري الأصغر. أتاحت نمذجة الشبكة دراسة تأثير المعلمات المختلفة لهندسة الشبكة بالتفصيل على خصائص الأداء الرئيسية لفهم أنماط حركة المهام ذات الوصول غير المنتظم المكثف إلى الذاكرة. نتيجة لذلك ، تم اختيار أحجام المخزن المؤقت الأمثل ، وعدد القنوات الافتراضية ، وتم تحليل الاختناقات المحتملة.

في عام 2008 ، ظهر أول نموذج أولي لجهاز توجيه FPGA - تم تصميم شبكة من ست عقد على Virtex4 متصلة بتورباس 2x3 ، حيث تم تصحيح الوظيفة الأساسية لجهاز التوجيه ، وتم تنفيذ نقل البيانات المتسامحة مع الأخطاء ، وتمت كتابة برنامج التشغيل ومكتبة المستوى المنخفض وتصحيحها. MPI. أطلقت الآن تصميم الجيل الثالث ، الذي يتكون من تسع عقد متصلة في torus ثنائي الأبعاد 3x3. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. تم إيلاء اهتمام خاص لدعم العمليات الجماعية (البث والتخفيض) المنفذة باستخدام شبكة فرعية افتراضية لها طوبولوجيا شجرة مثبتة على طوروس متعدد الأبعاد. تدعم الشبكة على مستوى الجهاز نوعين من عمليات القراءة والقراءة والعمليات الذرية عن بُعد (الجمع و OR الحصري). يظهر مخطط تنفيذ القراءة عن بُعد (إرسال طلب وتلقي استجابة) في الشكل. 2 (التسجيل عن بعد والعمليات الذرية تتم بالمثل). في كتلة منفصلة ، يتم تطبيق المنطق لتجميع الرسائل المستلمة من الشبكة لزيادة مشاركة البيانات المفيدة لكل معاملة عند الإرسال من خلال واجهة مع مضيف (المضيف هو جسر جسر الذاكرة والذاكرة).

التين. 2. مخطط القراءة عن بعد في شبكة أنجارا

في طبقة وصلة البيانات ، يتم دعم نقل الحزمة الآمنة من الفشل. هناك أيضًا آلية لتجاوز قنوات الاتصال والعقد الفاشلة عن طريق إعادة إنشاء جداول التوجيه. لأداء عمليات خدمة متنوعة (على وجه الخصوص ، تكوين / إعادة إنشاء جداول التوجيه) وإجراء بعض العمليات الحسابية ، يتم استخدام معالج الخدمة. تستخدم الواجهة المضيفة PCI Express.

التين. 3. هيكل عقدة الحوسبة مع محول شبكة / جهاز توجيه "Angara"

الكتل الرئيسية لجهاز التوجيه:

  • واجهة مع النظام المضيف ، المسؤولة عن تلقي وإرسال الحزم على واجهة المضيف ،
  • وحدة حقن وإخراج تشكل حزم لإرسالها إلى الشبكة وتوزع رؤوس الحزم الواردة من الشبكة ،
  • وحدة معالجة طلب تعالج الحزم التي تتطلب معلومات من ذاكرة النظام المضيف (على سبيل المثال ، عمليات القراءة أو العمليات الذرية) ،
  • وحدة شبكة عمليات جماعية تعالج الحزم المرتبطة بالعمليات الجماعية ، ولا سيما تنفيذ عمليات التخفيض وتوليد حزم طلبات البث ،
  • وحدة عمليات الخدمة التي تعالج الحزم التي تذهب من وإلى المعالج الثانوي للخدمة ،
  • مفتاح يربط المدخلات من مختلف القنوات الافتراضية والمدخلات من الحاقن مع المخرجات إلى مختلف الاتجاهات والقاذفات ،
  • قنوات الاتصال لنقل واستقبال البيانات في اتجاه معين ،
  • وحدة إرسال بيانات لإرسال الحزم في اتجاه معين ؛ ووحدة استقبال وتوجيه لاستقبال الحزم وتحديد مصيرها في المستقبل.

يتم تنفيذ تفاعل المضيف (الرمز الذي يتم تنفيذه على المعالج المركزي) مع جهاز التوجيه عن طريق الكتابة إلى عناوين الذاكرة المعينة لعناوين مناطق موارد جهاز التوجيه (الإدخال / الإخراج المعينين بالذاكرة). يسمح هذا للتطبيق بالتفاعل مع جهاز التوجيه دون مشاركة kernel ، مما يقلل من الحمل الزائد لإرسال الحزم ، حيث إن التبديل إلى سياق kernel والظهر يستغرق أكثر من مائة دورة زمنية على مدار الساعة. لإرسال الحزم ، يتم استخدام إحدى مناطق الذاكرة ، والتي تعتبر بمثابة مخزن مؤقت للحلقة. هناك أيضًا منطقة منفصلة لأداء العمليات دون نسخ ذاكرة الذاكرة (تتم قراءة البيانات من الذاكرة ويكتبها محول شبكة الاتصالات من خلال عمليات DMA) ومنطقة بها سجلات تحكم. يتم التحكم في الوصول إلى موارد معينة من جهاز التوجيه عن طريق وحدة النووية.

لتحقيق قدر أكبر من الكفاءة ، تقرر أنه يجب تنفيذ مهمة حسابية واحدة فقط على عقدة واحدة ، مما أدى إلى التخلص من الحمل المرتبط باستخدام الذاكرة الظاهرية وتجنب تداخل المهام وتبسيط بنية جهاز التوجيه بسبب عدم وجود وحدة MMU كاملة وتجنب الكل تؤخر أعماله المتعلقة بالتواصل ، فضلاً عن تبسيط نموذج أمان الشبكة ، مما يلغي عنه أمان عمليات المهام المختلفة على عقدة واحدة. لم يؤثر هذا الحل على وظائف الشبكة كما هو محدد في المقام الأول للمهام كبيرة الحجم (على عكس InfiniBand ، وهي شبكة عالمية للمهام ذات الأحجام المختلفة). تم اتخاذ قرار مماثل في IBM Blue Gene ، حيث يتم فرض قيود على تفرد المهمة للقسم.

على مستوى الأجهزة ، يتم دعم العمل المتزامن مع جهاز التوجيه للعديد من مؤشرات الترابط / العمليات لمهمة واحدة - يتم تنفيذه في شكل العديد من قنوات الحقن المتاحة للاستخدام بواسطة العمليات من خلال العديد من المخازن المؤقتة للحلقات لتسجيل الحزم. يمكن تغيير عدد وحجم هذه المخازن المؤقتة بشكل حيوي.

وضع البرمجة الرئيسي لشبكة Angara هو الاستخدام المشترك لكل من MPI و OpenMP و Shmem ، وكذلك GASNet و UPC.

بعد الانتهاء من التحقق من النماذج الأولية للشبكة ، يتم التخطيط لإصدار شريحة VLSI. سيتم تصميم مجموعة VLSI النموذجية لتصحيح الأخطاء التكنولوجية الأساسية ، والعملية التكنولوجية ، والتحقق التجريبي لنتائج المحاكاة. سيحتوي النموذج الأولي على جميع الوظائف الأساسية ، والعمل مع واجهة PCI Express gen2 x16 والروابط التي تصل سرعتها إلى 75 جيجابت / ثانية.

من المزمع الترويج لشبكة Angara للسوق من خلال نسختين: كشبكة تجارية منفصلة في شكل بطاقات PCI Express لأنظمة المجموعات ذات المعالجات والشرائح القياسية ، وكجزء من نظام الشفرة رباعي المقبس يعتمد على معالجات AMD التي يتم تطويرها في NICEVT.

شاهد الفيديو: تعرف على الكمبيوتر الخارق "إيمان1". Meet "IMAN1" supercomputer (يوليو 2020).

Pin
Send
Share
Send
Send