হাইরকার্কিক এবং আংশিক ক্লাস্টারিং মধ্যে পার্থক্য

Anonim

হাইর্যাচিকাল বনাম আংশিক ক্লাস্টারিং

ক্লাস্টারিং তথ্য বিশ্লেষণের জন্য একটি মেশিন লার্নিং টেকনিক এবং অনুরূপ ডেটাগুলির গোষ্ঠীতে বিভক্ত। এই গ্রুপ বা অনুরূপ তথ্য সেট ক্লাস্টার হিসাবে পরিচিত হয়। ক্লাস্টারের বিশ্লেষণ ক্লাস্টারিং আলগোরিদিমগুলিতে দেখায় যা ক্লাস্টারগুলি স্বয়ংক্রিয়ভাবে সনাক্ত করতে পারে। শ্রেণিবদ্ধ এবং আংশিক ক্লাস্টারিং আলগোরিদিম দুটি ক্লাস দুটি। হায়ারারকিকাল ক্লাস্টারিং এলগরিদম ক্লাস্টারগুলির একটি অনুক্রমের মধ্যে তথ্য আপ বিভক্ত। পারস্পরিক অ্যালগরিদম পারস্পরিক বিচ্ছিন্ন পার্টিশনগুলির মধ্যে ডেটা বিভাজিত করে।

হাইগ্রারিকাল ক্লাস্টারিং কি?

হাইগ্রারিকাল ক্লাস্টারিং অ্যালগরিদম বড় সংখ্যাগুলিতে ছোট ছোট ক্লাস্টারগুলিকে মিলিত করে বা ছোট ছোট গোষ্ঠীর বিভক্ত করে চক্রের পুনরাবৃত্তি করে। কোনও ভাবেই এটি ডেনড্রাগ নামে একটি ক্লাস্টারের একটি অনুক্রমের জন্ম দেয়। সংবহনকারী ক্লাস্টারিং কৌশল বড়দের মধ্যে ক্লাস্টারগুলিকে একত্রিত করার নিচলতার পদ্ধতি ব্যবহার করে, যখন বিভেদমূলক ক্লাস্টারিং কৌশলটি ছোটোদের মধ্যে বিভক্তির শীর্ষ-ডাউন পদ্ধতি ব্যবহার করে। সাধারণভাবে, লোভী পদ্ধতিটি সিদ্ধান্ত নেওয়ার জন্য ব্যবহার করা হয় যেটি মজুদ / বিভাজক জন্য বড় / ছোট ক্লাস্টার ব্যবহৃত হয়। ইউক্লিডীয় দূরত্ব, ম্যানহাটানের দূরত্ব এবং কোসাইন সমকেন্দ্রটি সাংখ্যিক ডেটাগুলির জন্য অনুরূপতার সর্বাধিক ব্যবহৃত ম্যাট্রিক্স। অ-সাংখ্যিক ডেটার জন্য, হ্যামিং দূরত্বের মত মেট্রিক ব্যবহার করা হয়। এটা মনে রাখা গুরুত্বপূর্ণ যে পর্যায়ক্রমিক ক্লাস্টারিং জন্য প্রকৃত পর্যবেক্ষণ (উদাহরণ) প্রয়োজন হয় না, কারণ শুধুমাত্র ম্যাট্রিক্স দূরত্ব যথেষ্ট। ডেনডোগ্রামটি ক্লাস্টারগুলির একটি দৃশ্যমান উপস্থাপনা, যা অনুক্রমটি খুব স্পষ্টভাবে প্রদর্শন করে। ডেনডোগ্রামটি কাটা হয় এমন স্তরের উপর নির্ভর করে ব্যবহারকারী বিভিন্ন ক্লাস্টারিং পেতে পারেন।

--২ ->

আংশিক ক্লাস্টারিং কি?

আংশিক ক্লাস্টারিং আলগোরিদিম বিভিন্ন বিভাজন উৎপন্ন করে এবং তারপর কিছু মানদণ্ড দ্বারা তাদের মূল্যায়ন করে। প্রত্যেকটি ক্ষেত্রে একে অপরের পারস্পরিক একচেটিয়া ক্লাস্টারের মধ্যে স্থাপন করা হয়। যেহেতু ক্লাস্টারগুলির একটি সেট শুধুমাত্র একটি নির্দিষ্ট আংশিক ক্লাস্টারিং অ্যালগরিদমের আউটপুট, ব্যবহারকারীকে প্রয়োজনীয় সংখ্যক ক্লাস্টারগুলি (সাধারণত k কে) ইনপুট করতে হয়। সর্বাধিক ব্যবহৃত আংশিক ক্লাস্টারিং অ্যালগরিদমগুলির একটি হলো k- মানে ক্লাস্টারিং আলগোরিদিম। ব্যবহারকারী শুরু করার আগে ক্লাস্টার সংখ্যা (k) প্রদান করতে হবে এবং অ্যালগরিদম প্রথমে k পার্টিশনের কেন্দ্র (বা centroids) শুরু করে। সংক্ষিপ্তভাবে, কে-মানে ক্লাস্টারিং অ্যালগরিদম তারপর বর্তমান কেন্দ্রের উপর ভিত্তি করে সদস্য নিয়োগ করে এবং বর্তমান সদস্যদের উপর ভিত্তি করে কেন্দ্রগুলি পুনরায় হিসাব করে। একটি নির্দিষ্ট আন্তঃ-ক্লাস্টার সমতা লক্ষ্য ফাংশন এবং আন্তঃকুলার অসমতা উদ্দেশ্য ফাংশন অপ্টিমাইজ করা হয় না হওয়া পর্যন্ত এই দুটি ধাপগুলি পুনরাবৃত্তি করা হয়।অতএব, কেন্দ্রীভূত বিশ্লেষণের শুরুতে আংশিক ক্লাস্টারিং আলগোরিদিম থেকে গুণগত ফলাফল প্রাপ্তির জন্য একটি গুরুত্বপূর্ণ বিষয়।

হাইগ্রারিক্যাল এবং আংশিক ক্লাস্টারিং এর মধ্যে পার্থক্য কি?

হাইর্যাচিকাল এবং আংশিক ক্লাস্টারিংয়ের সময়, অনুমান, ইনপুট প্যারামিটার এবং পরিণামের ক্লাস্টারগুলি চলতে থাকা গুরুত্বপূর্ণ পার্থক্য রয়েছে। সাধারণত, আংশিক ক্লাস্টারিং হায়ারার্কিক ক্লাস্টারিংয়ের চেয়ে দ্রুত। অনুক্রমিক ক্লাস্টারিং শুধুমাত্র একটি অনুরূপ পরিমাপ প্রয়োজন, আংশিক ক্লাস্টারিং যেমন ক্লাস্টার সংখ্যা এবং প্রাথমিক কেন্দ্রে শক্তিশালী দৃঢ়তা প্রয়োজন অনুক্রমিক ক্লাস্টারিং কোন ইনপুট প্যারামিটার প্রয়োজন হয় না, যখন আংশিক ক্লাস্টারিং অ্যালগরিদম ক্লাস্টার সংখ্যা চালনা শুরু করতে প্রয়োজন হাইগ্রারিক্যাল ক্লাস্টারিং ক্লাস্টারের আরও অর্থবহ এবং পার্সোনালি ডিভিশন ফেরত দেয় কিন্তু ঠিক কি ক্লাস্টারগুলিতে আংশিক ক্লাস্টারিং ফলাফল। হায়ারারকিকাল ক্লাস্টারিং অ্যালগরিদমগুলি যতটা সুনির্দিষ্ট তথ্যগুলির জন্য উপযুক্ত, ততদিন পর্যন্ত সমতুল্য পরিমাপটি সংজ্ঞায়িত করা যেতে পারে।