Лицензия

Лицензия Creative Commons
Материалы блога доступны по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.

Уважаемые читатели, если Вам понравилась публикация, распространите ее в социальных сетях (специальные кнопки внизу сообщений), это будет способствовать продвижению блога и подарит другим людям интересную информацию

С уважением Бугайчук К.Л.

Подумайте об этом

четверг, 2 августа 2012 г.

Карты памяти и data mining

В преддверие инициатив Нины Люлькун и Натальи Калиненко хочу ознакомить Вас с интересным ресурсом: "Учебник по data mining" автором является Ю. Денисов (там есть раздел по картам памяти). Этот раздел включает:
  1. Исторический обзор.
  2. Определение интеллект-карт.
  3. Принципы построения интеллект-карт.
  4. Отличие интеллект-карты от простой схемы (flow chart).
  5. Преимущества интеллект-карт.
  6. Свойства интеллект-карт.
Перед своим проектом он ставил такие цели: 
  1. Ознакомить широкую аудиторию Рунета, прежде всего студентов и работников высших учебных заведений, с новым направлением исследований – датамайнингом.
  2. Создать материалы для обучения датамайнингу в высших учебных заведениях г. Саратова.
  3. Опубликовать работу с целью подтверждения авторских прав (права на опубликоваия произведения).
По его определению датамайнинг – рутинный процесс поиска необходимых сведений в полноводных источниках информации, которые обрушиваются на человека в немыслимых количествах.

Современные печатные издания, средства радио- и телевещания, Интернет ежедневно выплескивают на человека гигабайты информации. Однако, если проанализировать эти потки информации, получится что эти источники передают:
  • лишнюю информацию (многочисленные повторы, комментарии людей, на владеющей всей информацией и т.п.);
  • неполную информацию (освещенную только с одной стороны, подвергнутую авторской или государственной цензуре, в худшем случае – тенденциозную информацию);
  • противоречивую информацию (когда, наоборот, дается информация из разных источников без предварительной сортировки и анализа);
  • ненужную, «шумовую» информацию (когда даются собственные комментарии репортера, автора статьи и слова очевидцев события). Не зря говорят: «Врет, как очевидец!»
Для серьезной работы необходимо отделить «зерна от плевел», выделить именно ту информацию, которая необходима для написания работы, информирования начальства и, наконец, для принятия решения. Для этого и предназначен датамайнинг.

Работа обширная на 2 тома, которые включают в себя много выпусков. Ознакомиться с работой можно здесь.

4 комментария:

  1. Ну...Константин, задали вы задачку!)))
    Но посмотреть придется!!!))))
    Спасибо!!!)))

    ОтветитьУдалить
  2. Бегло просмотрел оглавление по ссылке. Пока тоже не читал.
    Но, в моем понимании в data mining бОльшее значение имеют статистические методы анализа информации, моделирование (нейронное, например) и др. методы аналитической обработки информации чем простые методы логической классификации объектов (хотя и они применяются на определенных этапах извлечения знаний).
    Некоторые статистические пакеты обработки данных имеют даже такой раздел - Data Mining, например Statistica.
    За интересную новость - спасибо! Занес в закладку "Для ознакомления".

    ОтветитьУдалить
    Ответы
    1. Действительно, Data Mining -- это совершенно другое, поэтому, хотя информация и интересная, отнестись к ней нужно критически. Помните грамотность критического потребления? Think like detective! Труд достаточно объемный, а библиографического списка НЕТ. И об авторе минимум информации. Так что триангулируем (ищем дополнительные источники) ;)

      Удалить