خوارزمية متوازنة تفرعية للتنقيب عن النماذج المتكررة في تيار بيانات مستمرة

تلعب خوارزميات التنقيب عن العناصر المتكررة (Frequent Itemset) دوراً هاماً في إيجاد قواعد الترابط (Association Rules) من تيار بيانات مستمرة (Data Stream) مثل: البيانات الناتجة عن تتبع سلوك الزبائن، ومراقبة الشبكات، إلخ. تشكل الطبيعة المستمرة وغير المحدودة والسرعة العالية لتيار البيانات تحدياً كبير...

Full description

Saved in:
Bibliographic Details
Main Authors: Zakria Mahrousa (Author), Dima Mufti Alchawafa (Author), Hasan Kazzaz (Author)
Format: Book
Published: Tishreen University, 2020-07-01T00:00:00Z.
Subjects:
Online Access:Connect to this object online.
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:تلعب خوارزميات التنقيب عن العناصر المتكررة (Frequent Itemset) دوراً هاماً في إيجاد قواعد الترابط (Association Rules) من تيار بيانات مستمرة (Data Stream) مثل: البيانات الناتجة عن تتبع سلوك الزبائن، ومراقبة الشبكات، إلخ. تشكل الطبيعة المستمرة وغير المحدودة والسرعة العالية لتيار البيانات تحدياً كبيراً للعديد من الخوارزميات الحالية في مجال التنقيب عن النماذج المتكررة. بهدف تخفيض درجة تعقيد عملية إيجاد العناصر المتكررة من تيار بيانات مستمرة نقترح في هذا البحث تطوير خوارزمية FP-growth وتوزيع عملية التنقيب من خلال البنية MapReduce على أكثر من حاسب في الإطار هادوب Hadoop وباستخدام طريقة فعّالة من أجل موازنة الأحمال بين العقد الحسابية، وإيجاد الترابط بين مداولات(Transactions)  قاعدة البيانات. حيث تم اقتراح خوارزمية (Balanced Parallel Graph Frequent Pattern BPGFP-growth) وهي خوارزمية مُطورة عن FP-growth تقوم بمسح البيانات لمرة واحدة فقط، وتعتمد على الغراف الموجه (Directed Graph) والهادوب وطريقة لموازنة وتقسيم البيانات من أجل تخفيض الزمن اللازم لإيجاد العناصر المتكررة وحجم البيانات المتبادلة بين العقد الحسابية. تم اختبار الخوارزمية المقترحة على قواعد بيانات قياسية، وأثبتت النتائج قدرة الخوارزمية على القيام بعملية التنقيب في قواعد البيانات المتغيرة. وتخفيض كبير في معدل استهلاك الذاكرة، بالإضافة إلى تخفيض التعقيد بالنسبة إلى الزمن.
Item Description:2079-3081
2663-4279