Пресметка од Правилата за асоцијација - преземање на ppt

Пресметка на правилата на асоцијација Предавање во складиште на податоци и рударство

пресметка

Содржина Вовед: Потекло, номенклатура Априори: основен алгоритам Хиерархиски ставки Предмети вреднувани за квантитет Правила за асоцијација на Outlook

Вовед Креирање на априори хиерархија, количина Вовед Создавање поголеми множества на податоци, попрецизни множества на податоци, подобри хардверски ресурси. Ireелба за препознавање интересни правила во овие големи множества на податоци.

Номенклатура на трансакции: Дејство врз база на податоци (купување.) Вовед Хиерархија на априори, количина Трансакција со номенклатурата: Дејство врз база на податоци (купување.) Точка: Дел од трансакција (млеко.) Збир на артикл: Количина на артикли Правило на здружение: X  Y (ако трансакцијата содржи X, тогаш исто така содржи Y) Доверба c: c% од трансакциите се придржуваат до Правилата за здружување (minconf: долната граница за алгоритам) Поддршка s: s% од трансакциите содржат X и Y (minsup: долната граница за алгоритам) Правила на асоцијација

Пример T1 T2 Вовед Количина на хиерархија во априори Пример T1 T2 T3 T4 T5 Доверба Поддршка на леб  Сирење 100% 40% сирење  млеко 66,6% 40% паста за заби  чоколадо 50% 20% Правила на здружување

Вовед Хиерархија на Априори Количина мотивација ireелба за машинско препознавање на овие правила на здружение: Алгоритам „Априори“ Некои ставки имаат основна зависност, хиерархиско потекло (млеко  полномасно млеко) Одредени асоцијациски правила имаат потреба од квантитативни ставки (2 автомобили  2 деца над 18 години) Правила на здружението

Вовед Алгоритам на количината на хиерархија во априори, правила за откривање асоцијација на априори може да се подели на два проблема. Пронајдете ги сите комплети ставки со минимална поддршка Користете ги овие комплети ставки за да ги одредите Правилата за здружение на Правилата за асоцијација

Пронајдете множества ставки Пронајдете ги сите комплети ставки со минимална поддршка Вовед Априори хиерархија Количина Најдете ги комплетите ставки Најдете ги сите комплети ставки со минимална поддршка Започнете со комплети со еден елемент (1 сета) -> едноставно „броење“ Комбинирајте ги определените (k-1) множества во нови k-множества Придружен чекор: Создавање кандидати Чекор за режење: Бришење на сите кандидати кои имаат „погрешно“ подмножество Правила на здружението

Пример: Множества ставки Пример: Кандидати со 3 сета за 4 серии Вовед Хиерархија на априори Количина Пример: Комплети со предмети Пример: Кандидати со 3 сета за 4 сета Придружи се на Правилата за асоцијација на 4-комплети со сливи

Генерација на генерации на правила за здружение Вовед Априори Хиерархија Количина Генерирање Правила за генерација на здруженија Испитување на сите подмножества а од множеството ставки I a  (I - a), ако Поддршка (I) Поддршка (a)> = minconf Правила за здружение

Пример: Генерирање на воведување на априори хиерархија, количина Пример: Генерација I = [40%] Подмножества: minconf = 75%  Поддршка (I) = 40% Поддршка (а) = 50% Доверба = 80% ОК!  Поддршка (I) = 40% Поддршка (a) = 80% Доверба = 50% НЕ! Правила за здружување

Вовед Количина на хиерархија во априори Вовед Досега: Млеко  леб [80%] би било многу поинформативно ако диетално млеко  бел леб [75%] посакаат правила за асоцијација на хиерархија

Пример Колку подметката е подлабоко во хиерархијата, толку повеќе се воведува априорна хиерархија, количина, пример, храна, млеко, леб. Диета Целосно бело интегрално жито. Колку подлабоко е една ставка во хиерархијата, толку е помала потребната поддршка треба да биде Правила за здружување

Екстензија за кодирање на Apriori: Воведување на количината на хиерархијата на Apriori Кодирање на Apriori за кодирање: Кодирање на различните производи Млеко 1 Диетално млеко 11 Полномасно млеко 12 Леб 2 Бел леб 21 Леб од цело зрно 22 Табела за трансакција: Т1: Т2:. Правила за здружување

Комплети на прва ставка Прво на највиско ниво Пребарување на множества ставки: Вовед априорна хиерархија, количина Множества на први ставки Прво на највисоко ниво, пребарување на множества ставки: Пресметка на правилата за асоцијација и филтрирање на табелата за трансакции 30% 40% 30% Т1: Т2: Правила за здружување

Вовед Хиерархија Априори Кол Повторување на повторување: Пребарај ги следните комплети на филтрирана табела (до табелата празна или на крајот од хиерархијата) Пресметка на правилата за асоцијација и филтрирање на табелата за трансакции 20% 30% 30% 20% 20% Правила на здружување

Вовед Досега: само „бинарни“ Правила на здружение на пр. Леб  млеко количина на хиерархија во априори Вовед Досега: само „бинарни“ асоцијативни правила на пр. Леб Ext Продолжување на млеко на „квантитативни“ Правила на здружение, на пр.  R Правила на здружение

Проблеми Тривијална конверзија на вредноста поставена во бинарна табела, НО: Воведување на априорна хиерархиска количина Проблеми Тривијална конверзија на вредноста поставена во бинарна табела, НО: Бројот на елементот експлодира (време на извршување!) Број на правила експлодира Правила на здружението

Изменет алгоритам на интервали: Вовед Априори Хиерархиска количина Интервали Изменет алгоритам: Избран е интервал за секој атрибут на количината Правила на здружување

Избор на интервали Проблем со избор на интервал: Вовед Количина на хиерархија во априори Избор на интервали Проблем со избор на интервал: премногу комбинации на интервали Воведување на делумна комплетност: мерка на губење на информации при генерализирање на интервал Правила на здружението

Делумна комплетност k-делумна комплетност: Вовед Количина на хиерархија на априори Делумна комплетност k-делумна комплетност: За генерализирање на множество ставки, поддршката не смее да се зголемува за повеќе од факторот k 1,5-делумно-целосна: 5% 6% 8% 5% 6 % 6% 8% 6% Правила на здружување

Намалување на АР Бришење на „очекуваната“ асоцијација Правила за правила Вовед Априори хиерархиска количина Намалување на АР Бришење на „очекуваната“ асоцијација Правила 12x 3х -> 8% поддршка, 70% доверба -> 2% поддршка, 70% доверба Може да се избрише затоа што нема ново откритие Правила за здружување

Априори алгоритам за изгледите за хиерархијата на изгледите на априори: „априори“: оптимизирани верзии со побрзо траење или со помалку херхериски ставки на мемориските побарувања: не само што наоѓаат правила за асоцијација на исто ниво, туку и правила за асоцијација на различни нивоа