<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://ifigenia.org/index.php?action=history&amp;feed=atom&amp;title=Project%3ADMEU%2FData_mining</id>
	<title>Project:DMEU/Data mining - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://ifigenia.org/index.php?action=history&amp;feed=atom&amp;title=Project%3ADMEU%2FData_mining"/>
	<link rel="alternate" type="text/html" href="https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;action=history"/>
	<updated>2026-04-25T05:31:50Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.43.6</generator>
	<entry>
		<id>https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5655&amp;oldid=prev</id>
		<title>Vassia Atanassova: ifigenia: --&gt; project:</title>
		<link rel="alternate" type="text/html" href="https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5655&amp;oldid=prev"/>
		<updated>2011-08-20T15:56:19Z</updated>

		<summary type="html">&lt;p&gt;ifigenia: --&amp;gt; project:&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 18:56, 20 August 2011&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot;&gt;Line 1:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;__NOTOC__&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;__NOTOC__&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{{&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Ifigenia&lt;/del&gt;:DMEU/menu}}&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{{&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Project&lt;/ins&gt;:DMEU/menu}}&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;Data Mining&amp;#039;&amp;#039;&amp;#039;  или на български &amp;#039;&amp;#039;&amp;#039;извличане на знания от данни&amp;#039;&amp;#039;&amp;#039; е процес на откриване на смислени корелации, зависимости, повтарящи се образци (patterns), тенденции и аномалии в големи масиви от данни, съхранявани в [[:wikipedia:bg:склад от данни|складове]] чрез използване на техники и алгоритми от областта на [[:wikipedia:bg:машинно обучение|машинното обучение]], [[:wikipedia:bg:разпознаване на образи|разпознаването на образи]],  &lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;Data Mining&amp;#039;&amp;#039;&amp;#039;  или на български &amp;#039;&amp;#039;&amp;#039;извличане на знания от данни&amp;#039;&amp;#039;&amp;#039; е процес на откриване на смислени корелации, зависимости, повтарящи се образци (patterns), тенденции и аномалии в големи масиви от данни, съхранявани в [[:wikipedia:bg:склад от данни|складове]] чрез използване на техники и алгоритми от областта на [[:wikipedia:bg:машинно обучение|машинното обучение]], [[:wikipedia:bg:разпознаване на образи|разпознаването на образи]],  &lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;статистиката, [[:wikipedia:bg:невронни мрежи|невронните мрежи]] и визуализацията на данни. За разлика от извличането на данни посредством заявки към [[:wikipedia:bg:база данни|база данни]], извличането на знания от данните генерира имплицитно формулирана, неочевидна, предварително неизвестна, потенциално полезна информация.&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;статистиката, [[:wikipedia:bg:невронни мрежи|невронните мрежи]] и визуализацията на данни. За разлика от извличането на данни посредством заявки към [[:wikipedia:bg:база данни|база данни]], извличането на знания от данните генерира имплицитно формулирана, неочевидна, предварително неизвестна, потенциално полезна информация.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Vassia Atanassova</name></author>
	</entry>
	<entry>
		<id>https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5639&amp;oldid=prev</id>
		<title>Vassia Atanassova: Ifigenia:DMEU/Data mining moved to Project:DMEU/Data mining</title>
		<link rel="alternate" type="text/html" href="https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5639&amp;oldid=prev"/>
		<updated>2011-08-20T15:53:28Z</updated>

		<summary type="html">&lt;p&gt;&lt;a href=&quot;/index.php?title=Ifigenia:DMEU/Data_mining&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Ifigenia:DMEU/Data mining (page does not exist)&quot;&gt;Ifigenia:DMEU/Data mining&lt;/a&gt; moved to &lt;a href=&quot;/wiki/Project:DMEU/Data_mining&quot; title=&quot;Project:DMEU/Data mining&quot;&gt;Project:DMEU/Data mining&lt;/a&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Revision as of 18:53, 20 August 2011&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-notice&quot; lang=&quot;en&quot;&gt;&lt;div class=&quot;mw-diff-empty&quot;&gt;(No difference)&lt;/div&gt;
&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;</summary>
		<author><name>Vassia Atanassova</name></author>
	</entry>
	<entry>
		<id>https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5524&amp;oldid=prev</id>
		<title>Evdokia Sotirova: New page: __NOTOC__ {{Ifigenia:DMEU/menu}} &#039;&#039;&#039;Data Mining&#039;&#039;&#039;  или на български &#039;&#039;&#039;извличане на знания от данни&#039;&#039;&#039; е процес на откриване на ...</title>
		<link rel="alternate" type="text/html" href="https://ifigenia.org/index.php?title=Project:DMEU/Data_mining&amp;diff=5524&amp;oldid=prev"/>
		<updated>2011-08-19T17:14:48Z</updated>

		<summary type="html">&lt;p&gt;New page: __NOTOC__ {{Ifigenia:DMEU/menu}} &amp;#039;&amp;#039;&amp;#039;Data Mining&amp;#039;&amp;#039;&amp;#039;  или на български &amp;#039;&amp;#039;&amp;#039;извличане на знания от данни&amp;#039;&amp;#039;&amp;#039; е процес на откриване на ...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;__NOTOC__&lt;br /&gt;
{{Ifigenia:DMEU/menu}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Data Mining&amp;#039;&amp;#039;&amp;#039;  или на български &amp;#039;&amp;#039;&amp;#039;извличане на знания от данни&amp;#039;&amp;#039;&amp;#039; е процес на откриване на смислени корелации, зависимости, повтарящи се образци (patterns), тенденции и аномалии в големи масиви от данни, съхранявани в [[:wikipedia:bg:склад от данни|складове]] чрез използване на техники и алгоритми от областта на [[:wikipedia:bg:машинно обучение|машинното обучение]], [[:wikipedia:bg:разпознаване на образи|разпознаването на образи]], &lt;br /&gt;
статистиката, [[:wikipedia:bg:невронни мрежи|невронните мрежи]] и визуализацията на данни. За разлика от извличането на данни посредством заявки към [[:wikipedia:bg:база данни|база данни]], извличането на знания от данните генерира имплицитно формулирана, неочевидна, предварително неизвестна, потенциално полезна информация.&lt;br /&gt;
&lt;br /&gt;
Възникването и развитието на областта се явява естествено следствие от нарасналата употреба на бази данни и приложенията им в бизнеса. Традиционните средства за заявки към [[:wikipedia:bg:система за управление на база данни|системата за управление на базата данни]] се използват за описание и извличане на точни масиви от данни от базата. В тези случаи потребителят е формулирал някаква хипотеза, която проверява посредством върнатите от системата данни. За разлика от по-общото [[:wikipedia:bg:извличане на информация|извличане на информация]] (&amp;#039;&amp;#039;information retrieval, data retrieval&amp;#039;&amp;#039;), потребителят използва извличането на знания от данни, &amp;#039;&amp;#039;за да генерира&amp;#039;&amp;#039; хипотези.&lt;br /&gt;
&lt;br /&gt;
== Етапи ==&lt;br /&gt;
Процесът на извличане на знания от данни се състои от шест основни етапа:&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Разбиране на проблемната област (Business understanding)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — това е началният етап, който се фокусира върху дефинирането на целите на изследванията и съответните изисквания от гледната точка на потребителя. След завършването на етапа тези знания трябва да бъдат превърнати в дефиниции на задачи за сондиране на данни и да се състави предварителен план как тези цели могат да бъдат постигнати.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Разбиране на данните (Data understanding)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — започва с първоначално събиране на данни и продължава с дейности, целящи задълбочаване на знанията на изследователя за естеството на данните. На този етап е необходимо да бъдат идентифицирани проблеми, свързани с качеството на данните, да бъде получено първоначално мнение за характера на данните, да бъдат намерени интересните подмножества на данните, за да бъдат формирани първоначални хипотези за скритата в данните информация.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Подготовката на данните (Data preparation)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — покрива всички дейности по създаване от първоначални „сурови“ данни на крайното множество от данни (т.е. данни, които ще бъдат използвани от моделиращите средства). Етапът на подготовката на данни често се налага да бъде изпълняван многократно и по различно време. Задачите по подготовката на данни включват в себе си избор на таблиците с данни, техни атрибути и отделни записи, както и трансформация и изчистване на данни.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Mоделиране (Modeling)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — този етап се състои от избор и прилагане на различни техники за моделиране, целящи извличане на закономерности от данните. Параметрите на моделите се калибрират до свои оптимални стойности. Тъй като някои модели имат свои специфични изисквания към форм&amp;amp;#768;ата на данните, на този етап често се налага връщането към етапа за подготовката на данни.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Оценка на модела (Model evaluation)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — етапът се състои във внимателно преглеждане на всички стъпки, изпълнени при създаването на конкретния модел, за да се осигури, че те постигат поставените цели. В края на този етап се приема решение за използване на получените в процеса на сондиране резултати.&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039;Експлоатация на модела (Deployment)&amp;#039;&amp;#039;&amp;#039;&amp;#039;&amp;#039; — свързана е с необходимостта от наблюдение и стратегия за експлоатация. На този етап следва да се определи дали и кога да се поднови процедурата по извличане на знания от данни и при какви условия.&lt;br /&gt;
&lt;br /&gt;
В литературата тези шест етапа се срещат и окрупнени до три: &amp;#039;&amp;#039;Подготовка на данните&amp;#039;&amp;#039;, &amp;#039;&amp;#039;Прилагане на алгоритъм за сондиране&amp;#039;&amp;#039; и &amp;#039;&amp;#039;Анализ на резултата&amp;#039;&amp;#039;.&lt;br /&gt;
&lt;br /&gt;
== Използвани техники ==&lt;br /&gt;
Обичайно използваните техники за извличане на знания от данни включват [[:wikipedia:bg:дърво на решенията|дървета на решенията]], асоциативни правила, невронни мрежи, [[:wikipedia:bg:размита логика|размита логика]], генетични алторитми, клъстерен анализ по „метода на най-близкия съсед“.&lt;br /&gt;
&lt;br /&gt;
== Терминология ==&lt;br /&gt;
Терминът &amp;#039;&amp;#039;извличане на знания от данни&amp;#039;&amp;#039;, на английски &amp;#039;&amp;#039;knowledge discovery in databases&amp;#039;&amp;#039;, е възприет като български превод на популярния термин &amp;#039;&amp;#039;data mining&amp;#039;&amp;#039;, въпреки че на английски двата термина не винаги се смятат за точни синоними. В някои източници &amp;#039;&amp;#039;data mining&amp;#039;&amp;#039; се посочва само като един от етапите на &amp;#039;&amp;#039;knowledge discovery in databases&amp;#039;&amp;#039;. В българските източници е широко възприето да се ползва английският термин, както и транслитерацията му &amp;#039;&amp;#039;дейта майнинг&amp;#039;&amp;#039;, а се срещат и отделни преводи като &amp;#039;&amp;#039;сондиране на данни&amp;#039;&amp;#039;, &amp;#039;&amp;#039;интелектуален анализ на данните&amp;#039;&amp;#039;, &amp;#039;&amp;#039;интелигентен анализ на данните&amp;#039;&amp;#039;, &amp;#039;&amp;#039;дълбочинен анализ на данните&amp;#039;&amp;#039;, &amp;#039;&amp;#039;добиване на данни&amp;#039;&amp;#039;, &amp;#039;&amp;#039;добив на данни&amp;#039;&amp;#039;, &amp;#039;&amp;#039;целенасочено търсене на данни&amp;#039;&amp;#039; и други.&lt;br /&gt;
&lt;br /&gt;
== Източници ==&lt;br /&gt;
* &amp;#039;&amp;#039;Introduction to Data Mining and its Applications&amp;#039;&amp;#039;, S. Sumathi, S. N. Sivanandam, In series: &amp;quot;Studies in Computational Intelligence&amp;quot; No. 29, Springer-Verlag Berlin Heidelberg 2006, ISBN 978-3-540-34350-9&lt;br /&gt;
* [http://bg.wikipedia.org/wiki/Извличане_на_знания_от_данни Data Mining (Извличане на знания от данни)], от Уикипедия, свободната енциклопедия&lt;/div&gt;</summary>
		<author><name>Evdokia Sotirova</name></author>
	</entry>
</feed>