BitcoinWorld
যুগান্তকারী হার্ভার্ড গবেষণায় AI রোগ নির্ণয়ের নির্ভুলতা জরুরি বিভাগের চিকিৎসকদের ছাড়িয়ে গেছে
একটি যুগান্তকারী হার্ভার্ড গবেষণায় প্রকাশ পেয়েছে যে নির্দিষ্ট কিছু ক্লিনিকাল পরিস্থিতিতে AI জরুরি বিভাগের চিকিৎসকদের চেয়ে আরও নির্ভুল রোগ নির্ণয় করতে পারে, যা চিকিৎসা কৃত্রিম বুদ্ধিমত্তায় একটি গুরুত্বপূর্ণ মাইলফলক। Science জার্নালে প্রকাশিত এই গবেষণায় দেখা গেছে যে OpenAI-এর বৃহৎ ভাষা মডেলগুলো বাস্তব জরুরি বিভাগের ক্ষেত্রে রোগীদের রোগ নির্ণয়ে মানব চিকিৎসকদের ছাড়িয়ে যেতে পারে।
হার্ভার্ড মেডিকেল স্কুল এবং বেথ ইসরায়েল ডিকোনেস মেডিকেল সেন্টারের গবেষকরা OpenAI-এর মডেলগুলো মানব চিকিৎসকদের তুলনায় কেমন পারফর্ম করে তা মূল্যায়ন করতে একাধিক পরীক্ষা-নিরীক্ষা পরিচালনা করেছেন। গবেষণায় বেথ ইসরায়েলের জরুরি বিভাগে আসা ৭৬ জন রোগীর উপর মনোযোগ দেওয়া হয়েছিল। দুজন অ্যাটেন্ডিং চিকিৎসক রোগ নির্ণয় প্রদান করেন, এবং OpenAI-এর o1 ও 4o মডেলগুলো নিজেরাও রোগ নির্ণয় করে। এরপর আরও দুজন অ্যাটেন্ডিং চিকিৎসক সব রোগ নির্ণয় মূল্যায়ন করেন, এটি না জেনে যে কোনটি মানুষের এবং কোনটি AI-এর।
ফলাফল ছিল অবাক করার মতো। প্রতিটি ডায়াগনস্টিক পয়েন্টে, o1 মডেলটি দুজন অ্যাটেন্ডিং চিকিৎসকের চেয়ে সামান্য ভালো বা সমতুল্য পারফর্ম করেছে। 4o মডেলটিও শক্তিশালী পারফরম্যান্স দেখিয়েছে। পার্থক্যগুলো সবচেয়ে বেশি স্পষ্ট ছিল প্রাথমিক ER ট্রাইয়েজের সময়, যেখানে তথ্য সীমিত এবং জরুরিতা বেশি।
ট্রাইয়েজ ক্ষেত্রে, o1 মডেলটি ৬৭% সময় সঠিক বা খুব কাছাকাছি রোগ নির্ণয় প্রদান করেছে। একজন চিকিৎসক এটি ৫৫% সময় অর্জন করেছেন, অন্যজন ৫০% সময় সঠিক ছিলেন। এটি রোগ নির্ণয়ের নির্ভুলতায় ১২ থেকে ১৭ শতাংশ পয়েন্টের উন্নতি উপস্থাপন করে।
গবেষণা দলটি জোর দিয়ে বলেছে যে তারা ডেটা পূর্ব-প্রক্রিয়া করেননি। AI মডেলগুলো প্রতিটি রোগ নির্ণয়ের সময় ইলেকট্রনিক মেডিকেল রেকর্ডে উপলব্ধ একই তথ্য পেয়েছে। এই পদ্ধতিটি মানব এবং মেশিনের যুক্তির মধ্যে একটি ন্যায্য তুলনা নিশ্চিত করেছে।
হার্ভার্ড মেডিকেল স্কুলে একটি AI ল্যাবের প্রধান এবং গবেষণার অন্যতম প্রধান লেখক অর্জুন মানরাই একটি প্রেস বিজ্ঞপ্তিতে বলেছেন: "আমরা AI মডেলটিকে কার্যত প্রতিটি মানদণ্ডের বিপরীতে পরীক্ষা করেছি, এবং এটি পূর্ববর্তী মডেল এবং আমাদের চিকিৎসক বেসলাইন উভয়কেই ছাড়িয়ে গেছে।"
OpenAI-এর o1 এবং 4o-এর মতো বৃহৎ ভাষা মডেলগুলো টেক্সট-ভিত্তিক চিকিৎসা তথ্য প্রক্রিয়াকরণে উল্লেখযোগ্য দক্ষতা দেখিয়েছে। তবে, গবেষণাটি দাবি করেনি যে AI জরুরি বিভাগে জীবন-মৃত্যুর সিদ্ধান্ত নেওয়ার জন্য প্রস্তুত। পরিবর্তে, এটি বাস্তব বিশ্বের রোগী পরিচর্যা পরিবেশে এই প্রযুক্তিগুলো মূল্যায়ন করার জন্য প্রাসঙ্গিক পরীক্ষামূলক ট্রায়ালের জরুরি প্রয়োজনীয়তা তুলে ধরেছে।
গবেষকরা সীমাবদ্ধতাও উল্লেখ করেছেন। তারা শুধুমাত্র টেক্সট-ভিত্তিক তথ্যের সাথে মডেলগুলো কেমন পারফর্ম করে তা অধ্যয়ন করেছেন। বিদ্যমান গবেষণাগুলো পরামর্শ দেয় যে বর্তমান ফাউন্ডেশন মডেলগুলো নন-টেক্সট ইনপুটের উপর যুক্তি করতে আরও সীমিত, যেমন মেডিকেল ছবি বা রোগীর ভাইটাল।
বেথ ইসরায়েলের একজন ডাক্তার এবং সহ-প্রধান লেখক অ্যাডাম রডম্যান গার্ডিয়ানকে বলেছেন যে AI রোগ নির্ণয়ের জবাবদিহিতার জন্য কোনো আনুষ্ঠানিক কাঠামো নেই। তিনি জোর দিয়ে বলেছেন যে রোগীরা এখনও জীবন-মৃত্যুর সিদ্ধান্ত এবং কঠিন চিকিৎসা পছন্দের ক্ষেত্রে মানুষকে তাদের গাইড করতে চান।
জরুরি চিকিৎসার জন্য সীমিত তথ্যের সাথে দ্রুত, নির্ভুল সিদ্ধান্তের প্রয়োজন। গবেষণাটি পরামর্শ দেয় যে AI জরুরি বিভাগের চিকিৎসকদের জন্য একটি শক্তিশালী সিদ্ধান্ত-সহায়তা সরঞ্জাম হিসেবে কাজ করতে পারে। সঠিক ডায়াগনস্টিক পরামর্শ প্রদান করে, AI ডায়াগনস্টিক ত্রুটি কমাতে এবং রোগীর ফলাফল উন্নত করতে সাহায্য করতে পারে।
তবে, ক্লিনিকাল ওয়ার্কফ্লোতে AI একীভূত করা চ্যালেঞ্জ উপস্থাপন করে। চিকিৎসকদের অবশ্যই প্রযুক্তিকে বিশ্বাস করতে হবে, এর সীমাবদ্ধতা বুঝতে হবে এবং রোগী পরিচর্যার চূড়ান্ত দায়িত্ব বজায় রাখতে হবে। গবেষণাটি ব্যাপক গ্রহণের আগে সতর্কতামূলক মূল্যায়নের আহ্বান জানায়।
গবেষণাটি দুটি OpenAI মডেল তুলনা করেছে: o1 এবং 4o। o1 মডেলটি সমস্ত ডায়াগনস্টিক পয়েন্টে ধারাবাহিকভাবে 4o-কে ছাড়িয়ে গেছে। এটি পরামর্শ দেয় যে নতুন, আরও উন্নত মডেলগুলো চিকিৎসা প্রয়োগে আরও বেশি নির্ভুলতা প্রদান করতে পারে।
সারণি: প্রাথমিক ট্রাইয়েজে ডায়াগনস্টিক নির্ভুলতা
| ডায়াগনস্টিক উৎস | নির্ভুলতার হার |
|---|---|
| OpenAI o1 Model | ৬৭% |
| চিকিৎসক ১ | ৫৫% |
| চিকিৎসক ২ | ৫০% |
| OpenAI 4o Model | চিকিৎসকদের সমতুল্য |
এই ফলাফলগুলো স্বাস্থ্যসেবায় AI-এর দ্রুত অগ্রগতি তুলে ধরে। তবে, গবেষণার লেখকরা ফলাফলগুলোকে অতি-ব্যাখ্যা করার বিরুদ্ধে সতর্ক করেন। নমুনার আকার ছোট ছিল এবং ক্লিনিকাল প্রসঙ্গ সীমিত ছিল।
চিকিৎসা বিশেষজ্ঞরা উৎসাহ এবং সতর্কতা উভয়ের সাথে প্রতিক্রিয়া জানিয়েছেন। কেউ কেউ AI-কে একটি রূপান্তরকারী সরঞ্জাম হিসেবে দেখেন যা বিশেষজ্ঞ-স্তরের রোগ নির্ণয়ে প্রবেশাধিকার গণতান্ত্রিক করতে পারে। অন্যরা প্রযুক্তির উপর অতিরিক্ত নির্ভরতা এবং ক্লিনিকাল বিচারের ক্ষয় নিয়ে উদ্বিগ্ন।
হার্ভার্ড গবেষণাটি স্বাস্থ্যসেবায় AI-এর সম্ভাবনাকে সমর্থন করে ক্রমবর্ধমান প্রমাণের সাথে যোগ করে। পূর্ববর্তী গবেষণাগুলো রেডিওলজি, প্যাথলজি এবং ডার্মাটোলজিতে AI-কে ভালো পারফর্ম করতে দেখিয়েছে। এই গবেষণাটি প্রমাণকে জরুরি চিকিৎসায় প্রসারিত করে, যা একটি উচ্চ-ঝুঁকির পরিবেশ।
ড. মানরাই জোর দিয়ে বলেছেন যে AI মডেলটিকে কার্যত প্রতিটি মানদণ্ডের বিপরীতে পরীক্ষা করা হয়েছিল এবং এটি পূর্ববর্তী মডেলগুলোকে ছাড়িয়ে গেছে। এটি পরামর্শ দেয় যে AI শুধু মানব পারফরম্যান্সের সাথে মিল রাখছে না বরং নির্দিষ্ট প্রসঙ্গে এটিকে ছাড়িয়ে যাচ্ছে।
গবেষণাটি গুরুত্বপূর্ণ নৈতিক প্রশ্ন উত্থাপন করে। AI রোগ নির্ণয় ভুল হলে কে দায়ী? রোগীর আস্থা ক্ষুণ্ণ না করে কীভাবে AI ক্লিনিকাল সিদ্ধান্ত গ্রহণে একীভূত করা উচিত? এই প্রশ্নগুলো নিয়ন্ত্রক, স্বাস্থ্যসেবা প্রদানকারী এবং প্রযুক্তি ডেভেলপারদের কাছ থেকে সতর্কতামূলক বিবেচনার প্রয়োজন।
বর্তমানে, AI রোগ নির্ণয়ের জবাবদিহিতার জন্য কোনো আনুষ্ঠানিক কাঠামো নেই। রডম্যান উল্লেখ করেছেন যে রোগীরা এখনও জীবন-মৃত্যুর সিদ্ধান্তের জন্য মানব নির্দেশনা চান। এটি পরামর্শ দেয় যে AI মানব দক্ষতাকে বাড়ানো উচিত, প্রতিস্থাপন নয়।
গবেষণার লেখকরা বাস্তব বিশ্বের রোগী পরিচর্যা পরিবেশে AI মূল্যায়ন করার জন্য প্রাসঙ্গিক ট্রায়ালের আহ্বান জানান। এই ধরনের ট্রায়ালগুলো AI-এর কার্যকারিতা, নিরাপত্তা এবং রোগীর ফলাফলের উপর প্রভাব সম্পর্কে আরও শক্তিশালী প্রমাণ সরবরাহ করবে।
প্রাসঙ্গিক ট্রায়ালগুলো সম্ভাব্য সমস্যাগুলো চিহ্নিত করতেও সাহায্য করবে, যেমন অ্যালগরিদমিক পক্ষপাত বা AI-এর উপর অতিরিক্ত নির্ভরতা। তারা বিভিন্ন রোগী জনগোষ্ঠী এবং ক্লিনিকাল পরিস্থিতিতে AI কেমন পারফর্ম করে তার ডেটা সরবরাহ করবে।
গবেষকরা তাদের কাজ চালিয়ে যাওয়ার পরিকল্পনা করেন, আরও রোগী এবং ক্লিনিকাল সাইট অন্তর্ভুক্ত করতে গবেষণা প্রসারিত করবেন। তারা নন-টেক্সট ইনপুটে AI মডেলগুলো পরীক্ষা করার লক্ষ্যও রাখেন, যেমন মেডিকেল ছবি এবং ল্যাবরেটরি ফলাফল।
রোগীদের জন্য, এই গবেষণাটি আরও নির্ভুল এবং সময়মতো রোগ নির্ণয়ের আশা দেয়। চিকিৎসকদের জন্য, এটি AI-কে একটি সিদ্ধান্ত-সহায়তা সরঞ্জাম হিসেবে ব্যবহার করার সুযোগ উপস্থাপন করে। তবে, উভয় গোষ্ঠীকেই AI-এর প্রতি বাস্তবসম্মত প্রত্যাশা নিয়ে যোগাযোগ করতে হবে।
AI মানব বিচারের প্রতিস্থাপন নয়। এটি একটি সরঞ্জাম যা ডায়াগনস্টিক নির্ভুলতা বাড়াতে পারে, বিশেষত জরুরি বিভাগের মতো উচ্চ-চাপের পরিস্থিতিতে। মূল বিষয় হলো AI-কে দায়িত্বশীলভাবে একীভূত করা, নিশ্চিত করা যে এটি ক্লিনিকাল দক্ষতার পরিপূরক হয়, ক্ষুণ্ণ নয়।
হার্ভার্ড গবেষণাটি বাধ্যকারী প্রমাণ সরবরাহ করে যে নির্দিষ্ট কিছু প্রসঙ্গে AI জরুরি বিভাগের চিকিৎসকদের চেয়ে আরও নির্ভুল রোগ নির্ণয় করতে পারে। OpenAI-এর o1 মডেলটি ট্রাইয়েজ নির্ভুলতায় মানব চিকিৎসকদের ছাড়িয়ে গেছে, স্বাস্থ্যসেবায় বৃহৎ ভাষা মডেলের সম্ভাবনা প্রদর্শন করে। তবে, গবেষণাটি ক্লিনিকাল পরিবেশে AI ব্যাপকভাবে গৃহীত হওয়ার আগে সতর্কতামূলক মূল্যায়ন, নৈতিক কাঠামো এবং প্রাসঙ্গিক ট্রায়ালের প্রয়োজনীয়তাও তুলে ধরে। AI যেহেতু ক্রমাগত বিকশিত হচ্ছে, চিকিৎসায় এর ভূমিকা সম্ভবত প্রসারিত হবে, তবে রোগীর নিরাপত্তা এবং বিশ্বাসের জন্য মানব তদারকি অপরিহার্য থাকে।
প্র১: হার্ভার্ড গবেষণা কীভাবে AI এবং মানব চিকিৎসকদের তুলনা করেছে?
উ১: গবেষকরা ৭৬টি জরুরি বিভাগের ক্ষেত্রে দুজন অ্যাটেন্ডিং চিকিৎসকের রোগ নির্ণয়ের সাথে OpenAI-এর o1 এবং 4o মডেলের রোগ নির্ণয় তুলনা করেছেন। আরও দুজন চিকিৎসক উৎস না জেনে রোগ নির্ণয়গুলো মূল্যায়ন করেছেন।
প্র২: গবেষণায় AI মডেলের নির্ভুলতার হার কত ছিল?
উ২: o1 মডেলটি ট্রাইয়েজ ক্ষেত্রে ৬৭% সময় সঠিক বা খুব কাছাকাছি রোগ নির্ণয় প্রদান করেছে, দুজন মানব চিকিৎসকের ৫৫% এবং ৫০% এর তুলনায়।
প্র৩: AI কি জরুরি বিভাগের চিকিৎসকদের প্রতিস্থাপন করতে প্রস্তুত?
উ৩: না। গবেষণাটি দাবি করে না যে AI বাস্তব-বিশ্বের ক্লিনিকাল সিদ্ধান্তের জন্য প্রস্তুত। এটি প্রাসঙ্গিক ট্রায়ালের আহ্বান জানায় এবং মানব তদারকি ও জবাবদিহিতার প্রয়োজনীয়তার উপর জোর দেয়।
প্র৪: চিকিৎসা রোগ নির্ণয়ে AI-এর সীমাবদ্ধতা কী?
উ৪: বর্তমান AI মডেলগুলো টেক্সট-ভিত্তিক তথ্যের মধ্যে সীমাবদ্ধ এবং মেডিকেল ছবি বা রোগীর ভাইটালের মতো নন-টেক্সট ইনপুটের সাথে ততটা ভালো পারফর্ম নাও করতে পারে। গবেষণাটি আনুষ্ঠানিক জবাবদিহিতা কাঠামোর অভাবও উল্লেখ করে।
প্র৫: স্বাস্থ্যসেবার ভবিষ্যতের জন্য এর অর্থ কী?
উ৫: AI-এর ডায়াগনস্টিক নির্ভুলতা উন্নত করার এবং ক্লিনিকাল সিদ্ধান্ত গ্রহণকে সহায়তা করার সম্ভাবনা রয়েছে। তবে, ব্যাপক গ্রহণের আগে সতর্কতামূলক একীকরণ, নৈতিক নির্দেশিকা এবং আরও গবেষণার প্রয়োজন।
This post AI Diagnosis Accuracy Surpasses Emergency Room Doctors in Groundbreaking Harvard Study first appeared on BitcoinWorld.

