عندما يتحدث الناس عن توسيع نطاق التجارة الإلكترونية، فإنهم يركزون على التحديات الهندسية الكبيرة: البحث الموزع، المخزون في الوقت الفعلي، محركات التوصية، وتحسين عملية الدفع. ولكن تحت كل ذلك تكمن مشكلة أكثر هدوءًا واستمرارًا يعاني منها كل بائع تجزئة تقريبًا: قيم السمات.
السمات هي العمود الفقري لاكتشاف المنتجات. فهي تشغّل الفلاتر والمقارنات وترتيب البحث ومنطق التوصيات. ولكن في الكتالوجات الفعلية، نادرًا ما تكون قيم السمات نظيفة. فهي غير متسقة أو مكررة أو ذات تنسيق خاطئ أو غامضة دلاليًا.
خذ شيئًا بسيطًا مثل الحجم. قد ترى:
Code
["XL", "Small", "12cm", "Large", "M", "S"]
أو اللون:
Code
["RAL 3020", "Crimson", "Red", "Dark Red"]
بشكل فردي، تبدو هذه التناقضات غير ضارة. ولكن عند ضربها في أكثر من 3 ملايين SKU، كل منها مع عشرات السمات، تصبح المشكلة منهجية. تتصرف الفلاتر بشكل غير متوقع، وتفقد محركات البحث الصلة، ويغرق التجار في التنظيف اليدوي، ويصبح اكتشاف المنتج أبطأ وأكثر إحباطًا للعملاء.
كان هذا هو التحدي الذي واجهته كمهندس برمجيات متكامل في Zoro، وهي مشكلة كان من السهل تجاهلها ولكنها أثرت على كل صفحة منتج.
لم أرغب في صندوق أسود غامض للذكاء الاصطناعي يقوم فقط بفرز الأشياء. من الصعب الوثوق بمثل هذه الأنظمة أو تصحيحها أو توسيع نطاقها. بدلاً من ذلك، استهدفت خط أنابيب كان:
كانت النتيجة خط أنابيب ذكاء اصطناعي هجين يجمع بين الاستدلال السياقي من LLMs مع قواعد واضحة وضوابط للتجار. إنه يتصرف بذكاء عند الحاجة، ولكنه يظل دائمًا قابلاً للتنبؤ. هذا ذكاء اصطناعي بحواجز حماية، وليس ذكاء اصطناعي خارج السيطرة.
تتم معالجة جميع السمات في مهام خلفية غير متصلة بالإنترنت، وليس في الوقت الفعلي. لم يكن هذا حلاً وسطًا؛ بل كان اختيارًا معماريًا استراتيجيًا.
تبدو خطوط الأنابيب في الوقت الفعلي جذابة، ولكن على نطاق التجارة الإلكترونية، فإنها تقدم:
من ناحية أخرى، منحتنا المهام غير المتصلة:
يعد الحفاظ على فصل الأنظمة التي تواجه العملاء عن خطوط معالجة البيانات أمرًا ضروريًا عند العمل مع ملايين SKUs.
قبل استخدام الذكاء الاصطناعي على البيانات، قمت بتشغيل خطوة معالجة مسبقة واضحة لإزالة الضوضاء والارتباك. قد تبدو هذه الخطوة بسيطة، لكنها حسنت بشكل كبير استدلال LLM.
تضمن خط أنابيب التنظيف:
هذا ضمن أن LLM تلقى مدخلات نظيفة وواضحة، وهو أمر أساسي للحصول على نتائج متسقة. القمامة في الداخل، القمامة في الخارج. على هذا النطاق، حتى الأخطاء الصغيرة يمكن أن تؤدي إلى مشاكل أكبر لاحقًا.
لم يكن LLM يقوم فقط بفرز القيم أبجديًا. بل كان يستدل عليها.
تلقت الخدمة:
مع هذا السياق، يمكن للنموذج أن يفهم:
أعاد النموذج:
يتيح هذا لخط الأنابيب التعامل مع أنواع مختلفة من السمات دون ترميز صلب للقواعد لكل فئة.
ليست كل سمة تحتاج إلى ذكاء اصطناعي.
في الواقع، يتم التعامل مع العديد من السمات بشكل أفضل بواسطة المنطق الحتمي.
غالبًا ما تستفيد النطاقات الرقمية والقيم المستندة إلى الوحدات والمجموعات البسيطة من:
اكتشف خط الأنابيب تلقائيًا هذه الحالات واستخدم المنطق الحتمي لها. هذا حافظ على كفاءة النظام وتجنب استدعاءات LLM غير الضرورية.
كان التجار لا يزالون بحاجة إلى التحكم، خاصة بالنسبة للسمات الحساسة للأعمال.
لذلك يمكن وسم كل فئة على النحو التالي:
يتيح نظام الوسم المزدوج هذا للأشخاص اتخاذ القرارات النهائية بينما قام الذكاء الاصطناعي بمعظم العمل. كما بنى الثقة، حيث يمكن للتجار تجاوز النموذج عند الحاجة دون كسر خط الأنابيب.
تم تخزين جميع النتائج مباشرة في قاعدة بيانات Product MongoDB، مع الحفاظ على بساطة الهندسة المعمارية ومركزيتها.
أصبحت MongoDB المتجر التشغيلي الوحيد لـ:
هذا سهّل مراجعة التغييرات، وتجاوز القيم، وإعادة معالجة الفئات، والمزامنة مع الأنظمة الأخرى.
بمجرد الفرز، تدفقت القيم إلى:
هذا ضمن أن:
البحث هو المكان الذي يكون فيه فرز السمات أكثر وضوحًا، وحيث يكون الاتساق أكثر أهمية.
لجعل هذا العمل عبر ملايين SKUs، صممت خط أنابيب معياري مبني حول المهام الخلفية واستدلال الذكاء الاصطناعي وتكامل البحث. يلتقط مخطط الهندسة المعمارية أدناه التدفق الكامل:
يضمن هذا التدفق أن كل قيمة سمة، سواء تم فرزها بواسطة الذكاء الاصطناعي أو تم تعيينها يدويًا، تنعكس في البحث والتسويق وتجربة العميل.
إليك كيف تم تحويل القيم الفوضوية:
| السمة | القيم الأولية | الإخراج المرتب | |----|----|----| | الحجم | XL, Small, 12cm, Large, M, S | Small, M, Large, XL, 12cm | | اللون | RAL 3020, Crimson, Red, Dark Red | Red, Dark Red, Crimson, Red (RAL 3020) | | المادة | Steel, Carbon Steel, Stainless, Stainless Steel | Steel, Stainless Steel, Carbon Steel | | رقمي | 5cm, 12cm, 2cm, 20cm | 2cm, 5cm, 12cm, 20cm |
توضح هذه الأمثلة كيف يجمع خط الأنابيب بين الاستدلال السياقي والقواعد الواضحة لإنشاء تسلسلات نظيفة وسهلة الفهم.
كانت المعالجة في الوقت الفعلي ستقدم:
منحتنا المهام غير المتصلة:
كان المقايضة هو تأخير صغير بين إدخال البيانات والعرض، ولكن الفائدة كانت الاتساق على نطاق واسع، وهو ما يقدره العملاء أكثر بكثير.
كانت النتائج كبيرة:
لم يكن هذا مجرد فوز تقني؛ بل كان أيضًا فوزًا لتجربة المستخدم والإيرادات.
يبدو فرز قيم السمات بسيطًا، ولكنه يصبح تحديًا حقيقيًا عندما يتعين عليك القيام بذلك لملايين المنتجات.
من خلال الجمع بين ذكاء LLM والقواعد الواضحة والتحكم في التجار، قمت بتحويل مشكلة معقدة ومخفية إلى نظام نظيف وقابل للتوسع.
إنه تذكير بأن بعضًا من أكبر الانتصارات تأتي من حل المشاكل المملة، تلك التي يسهل تفويتها ولكنها تظهر في كل صفحة منتج.
\n \n \n


