Upload
alireza-karimi
View
137
Download
0
Embed Size (px)
Citation preview
خوشه بندی مقاالت خبری WordNetبا استفاده از
استاد: خانم دکتر اطمینانی: ارائه دهنده
علیرضا کریمی
1391پاییز
:فهرست مطالبخوشه بندی چیست؟شیوه های خوشه بندیWordNetچ-یست؟ معماری سیستم خوشه بندی مقاالت خبری اجرا و پیاده سازیW-k meansکارهای آینده
خوشه بندی چیست؟:تعریف خوشه بندی
تقسیم داده ها درون دسته هایی به نام خوشه، بهطوریکه داده های درون هر خوشه تا حد امکان به هم شبیه بوده و داده های درون خوش های مختلف تا حد
امکان تا حد امکان با هم متفاوت باشند. خوشه بندی تکنیکی قدرتمند برای سازماندهی
اطالعات در هسته های اطالعاتی کوچکتر و قابل مدیریت
:شیوه های خوشه بندی تکنیک های خوشه بندی به دو دسته کلی تقسیم
می گردند:سلسله مراتبیافرازی
خوشه بندی افرازی: با تقسیم بندی یک سطحی خوشه یکباره ایجاد می گردد به kانجام می گیرد،
طوری که فاصله تمام اقالم داده ای از مراکز خوشه ها، حداقل گردد.
:شیوه های خوشه بندی خوشه بندی افرازی: با تقسیم بندی یک سطحی انجام
خوشه یکباره ایجاد می گردد به طوری kمی گیرد، که فاصله تمام اقالم داده ای از مراکز خوشه ها،
حداقل گردد. :برخی الگوریتم های خوشه بندی افرازی
K-meansK-mediansK-medoids
تفاوت این الگوریتم ها در یافتن مراکز خ-وشههاست.
:شیوه های خوشه بندی الگوری-تمEM برای k-means:
نقطه داده به عنوان مراکز ثقل اولیهkانتخاب 1.
تخص-یص د-اده ها به نزد-یکترین مرکز ثقل2.
محاسبه مرکز ثقل جدید برای هر خوشه3.
تا زمانی که د-یگر تغییری در مراکز 3و2تکرار مراحل 4.خوشه ها رخ ندهد.
WordNet :بزرگترین پایگاه داده واژگان انگلیسی واژه در گروه های 150000شامل بیش از
اسم-ی، فعلی، صفتی و قیدی امکان سازماندهی روابط مختلف زبانی بصورت
سلسله مراتبی با دادن یک لغت، روابطhypernym،
hyponym، meronymو holonym را با ساختار گرافی تولید می کند.
:معماری سیتم خوشه بندی مقاالت خبری
:W-k meansاجرا و پیاده سازی
:W-k meansاجرا و پیاده سازی
تابع هیورستیک :