Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (ReadAnyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (Read

Ray 2.55 বড় আকারের AI মডেল ডিপ্লয়মেন্টের জন্য ফল্ট টলারেন্স যোগ করেছে

2026/04/03 02:35
3 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে crypto.news@mexc.com ঠিকানায় যোগাযোগ করুন

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Joerg Hiller এপ্রিল ০২, ২০২৬ ১৮:৩৫

Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP স্থাপনার জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, বিতরণকৃত AI ইনফারেন্স সিস্টেমের জন্য ডাউনটাইম ঝুঁকি হ্রাস করে।

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Anyscale তার Ray Serve LLM ফ্রেমওয়ার্কে একটি গুরুত্বপূর্ণ আপডেট প্রকাশ করেছে যা বড় মাপের AI ইনফারেন্স ওয়ার্কলোড চালানো প্রতিষ্ঠানগুলির জন্য একটি গুরুত্বপূর্ণ অপারেশনাল চ্যালেঞ্জ সমাধান করে। Ray 2.55 vLLM ওয়াইড এক্সপার্ট প্যারালেলিজম স্থাপনার জন্য ডেটা প্যারালেল (DP) গ্রুপ ফল্ট টলারেন্স প্রবর্তন করে—একটি বৈশিষ্ট্য যা একক GPU ব্যর্থতাকে সম্পূর্ণ মডেল সার্ভিং ক্লাস্টার বন্ধ হওয়া থেকে প্রতিরোধ করে।

আপডেটটি মিক্সচার অফ এক্সপার্টস (MoE) মডেল সার্ভিংয়ের একটি নির্দিষ্ট সমস্যাকে লক্ষ্য করে। ট্র্যাডিশনাল মডেল স্থাপনার বিপরীতে যেখানে প্রতিটি রেপ্লিকা স্বাধীনভাবে কাজ করে, DeepSeek-V3-এর মতো MoE আর্কিটেকচার এক্সপার্ট লেয়ারগুলিকে GPU-এর গ্রুপ জুড়ে শার্ড করে যা সম্মিলিতভাবে কাজ করতে হয়। যখন এই কনফিগারেশনে একটি GPU ব্যর্থ হয়, তখন সম্পূর্ণ গ্রুপ—সম্ভাব্যভাবে 16 থেকে 128 GPU জুড়ে—অকার্যকর হয়ে পড়ে।

প্রযুক্তিগত সমস্যা

MoE মডেলগুলি একাধিক GPU জুড়ে বিশেষায়িত "এক্সপার্ট" নিউরাল নেটওয়ার্ক বিতরণ করে। উদাহরণস্বরূপ, DeepSeek-V3 প্রতি লেয়ারে 256টি এক্সপার্ট ধারণ করে কিন্তু প্রতি টোকেনে মাত্র 8টি সক্রিয় করে। টোকেনগুলি যেকোনো GPU-তে রাউট হয় যা প্রয়োজনীয় এক্সপার্টদের ডিসপ্যাচ এবং কম্বাইন অপারেশনের মাধ্যমে ধারণ করে যার জন্য সমস্ত অংশগ্রহণকারী র‍্যাঙ্কগুলিকে সুস্থ থাকতে হয়।

পূর্বে, একক র‍্যাঙ্ক ব্যর্থতা এই সম্মিলিত অপারেশনগুলি ভেঙে ফেলত। প্রভাবিত গ্রুপে বেঁচে থাকা রেপ্লিকাগুলিতে কোয়েরি রাউটিং অব্যাহত থাকত, কিন্তু প্রতিটি রিকোয়েস্ট ব্যর্থ হত। পুনরুদ্ধারের জন্য সম্পূর্ণ সিস্টেম পুনরায় চালু করা প্রয়োজন ছিল।

Ray কীভাবে এটি সমাধান করে

Ray Serve LLM এখন গ্যাং শিডিউলিংয়ের মাধ্যমে প্রতিটি DP গ্রুপকে একটি পারমাণবিক ইউনিট হিসাবে বিবেচনা করে। যখন একটি র‍্যাঙ্ক ব্যর্থ হয়, তখন সিস্টেমটি সম্পূর্ণ গ্রুপকে অসুস্থ হিসাবে চিহ্নিত করে, এতে ট্রাফিক রাউটিং বন্ধ করে, ব্যর্থ গ্রুপটি ভেঙে ফেলে এবং এটিকে একটি ইউনিট হিসাবে পুনর্নির্মাণ করে। অন্যান্য সুস্থ গ্রুপগুলি সর্বত্র রিকোয়েস্ট সার্ভিং চালিয়ে যায়।

বৈশিষ্ট্যটি Ray 2.55-এ ডিফল্টরূপে সক্ষম হয়ে শিপ করে। বিদ্যমান DP স্থাপনার জন্য কোনো কোড পরিবর্তনের প্রয়োজন নেই—ফ্রেমওয়ার্কটি স্বয়ংক্রিয়ভাবে গ্রুপ-স্তরের স্বাস্থ্য পরীক্ষা, শিডিউলিং এবং পুনরুদ্ধার পরিচালনা করে।

অটোস্কেলিং এই সীমানাগুলিকেও সম্মান করে। স্কেল-আপ এবং স্কেল-ডাউন অপারেশনগুলি পৃথক রেপ্লিকার পরিবর্তে গ্রুপ-আকারের বৃদ্ধিতে ঘটে, যা আংশিক গ্রুপের তৈরি প্রতিরোধ করে যা ট্রাফিক সার্ভ করতে পারে না।

অপারেশনাল প্রভাব

আপডেটটি একটি গুরুত্বপূর্ণ ডিজাইন বিবেচনা তৈরি করে: গ্রুপের প্রশস্ততা বনাম গ্রুপের সংখ্যা। Anyscale দ্বারা উদ্ধৃত vLLM বেঞ্চমার্ক অনুসারে, প্রতি GPU থ্রুপুট 32, 72, এবং 96 এর এক্সপার্ট প্যারালেল সাইজ জুড়ে তুলনামূলকভাবে স্থিতিশীল থাকে। এর অর্থ হল অপারেটররা দক্ষতা ত্যাগ না করে ছোট গ্রুপের দিকে টিউন করতে পারেন—এবং ছোট গ্রুপের অর্থ ব্যর্থতা ঘটলে ছোট ব্লাস্ট রেডিআই।

Anyscale উল্লেখ করে যে এই অর্কেস্ট্রেশন-স্তরের স্থিতিস্থাপকতা vLLM কমিউনিটিতে ঘটছে ইঞ্জিন-স্তরের ইলাস্টিসিটি কাজের পরিপূরক। vLLM ইলাস্টিক এক্সপার্ট প্যারালেলিজম RFC এ সম্বোধন করে যে কীভাবে রানটাইম একটি গ্রুপের মধ্যে গতিশীলভাবে টপোলজি সামঞ্জস্য করতে পারে, যখন Ray Serve LLM পরিচালনা করে কোন গ্রুপগুলি বিদ্যমান এবং ট্রাফিক গ্রহণ করে।

বড় মাপে DeepSeek-স্টাইল মডেল স্থাপন করা প্রতিষ্ঠানগুলির জন্য, ব্যবহারিক সুবিধা সরল: GPU ব্যর্থতাগুলি সিস্টেম-ব্যাপী বিভ্রাটের পরিবর্তে স্থানীয় ঘটনায় পরিণত হয়। কোড নমুনা এবং পুনরুত্পাদন পদক্ষেপগুলি Anyscale-এর GitHub রিপোজিটরিতে উপলব্ধ।

চিত্র সূত্র: Shutterstock
  • ray
  • vllm
  • এআই অবকাঠামো
  • মেশিন লার্নিং
  • বিতরণকৃত কম্পিউটিং
মার্কেটের সুযোগ
Raydium লোগো
Raydium প্রাইস(RAY)
$0.6144
$0.6144$0.6144
-0.61%
USD
Raydium (RAY) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য crypto.news@mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

রিপল সিইও অ্যাভালাঞ্চ প্রতিষ্ঠাতাকে পাল্টা জবাব দিলেন: জেনে ভালো লাগলো আমরা আপনার মাথায় বিনা ভাড়ায় থাকছি

রিপল সিইও অ্যাভালাঞ্চ প্রতিষ্ঠাতাকে পাল্টা জবাব দিলেন: জেনে ভালো লাগলো আমরা আপনার মাথায় বিনা ভাড়ায় থাকছি

প্রধান ব্লকচেইন ইকোসিস্টেমগুলোর মধ্যে প্রতিযোগিতা ক্রমাগত তীব্র হচ্ছে কারণ প্রকল্পগুলো দ্রুত পরিপক্ক হওয়া ডিজিটাল ক্ষেত্রে প্রাতিষ্ঠানিক প্রাসঙ্গিকতা এবং বর্ণনামূলক আধিপত্যের জন্য প্রতিদ্বন্দ্বিতা করছে
শেয়ার করুন
Timestabloid2026/04/03 03:05
ডাও জোনস ফিউচার্স দরপতন যেহেতু অস্থিতিশীল ভয়-আশা চক্র বাজারে অশান্তি ত্বরান্বিত করছে

ডাও জোনস ফিউচার্স দরপতন যেহেতু অস্থিতিশীল ভয়-আশা চক্র বাজারে অশান্তি ত্বরান্বিত করছে

বিটকয়েনওয়ার্ল্ড ডাও জোনস ফিউচার ধসে পড়ল যেহেতু অস্থির ভয়-আশা চক্র বাজারের বিশৃঙ্খলা ত্বরান্বিত করছে নিউ ইয়র্ক, মার্চ ২০২৫ – ডাও জোনস ইন্ডাস্ট্রিয়াল এভারেজ ফিউচার অনুভব করেছে
শেয়ার করুন
bitcoinworld2026/04/03 02:30
জিওপি আইনপ্রণেতা বিদায়ের পথে 'ভয়ানক' প্যাম বন্ডিকে কঠোর সমালোচনা করলেন

জিওপি আইনপ্রণেতা বিদায়ের পথে 'ভয়ানক' প্যাম বন্ডিকে কঠোর সমালোচনা করলেন

প্রতিনিধি ন্যান্সি মেস (R-SC) প্রাক্তন অ্যাটর্নি জেনারেল প্যাম বন্ডির সমালোচনা করেছেন প্রেসিডেন্ট ডোনাল্ড ট্রাম্প নিশ্চিত করার পর যে তিনি তাকে বরখাস্ত করেছেন।"বন্ডি এপস্টাইন ফাইলগুলি পরিচালনা করেছেন
শেয়ার করুন
Rawstory2026/04/03 03:55

24/7 লাইভ নিউজ

আরও

Trade GOLD, Share 1,000,000 USDT

Trade GOLD, Share 1,000,000 USDTTrade GOLD, Share 1,000,000 USDT

0 fees, up to 1,000x leverage, deep liquidity