АдукацыяНавука

Прадметная вобласць даследаванні

Любое даследаванне складаецца ў назіранні за ўласцівасцямі аб'ектаў у мэтах высвятлення і ацэньвання значных адносін і узаемасувязяў паміж паказчыкамі гэтых уласцівасцяў.

Прадметная вобласць ўключае ў сябе аб'екты, якія адрозніваюцца па ўласцівасцях і пэўным чынам знаходзяцца ў некаторых адносінах і ўзаемазвязаны паміж сабой. Рашэнне задач у галіне праграмавання пачынаецца з даследаванні прадметнай вобласці.

Прадметная вобласць - гэта частка сапраўднага свету, якая бясконцая і ўтрымлівае як значныя, так і неістотныя дадзеныя. Даследніку трэба ўмець вылучаць іх істотную частку. Напрыклад, вырашаючы задачу аб выдачы крэдыту, значнымі будуць лічыцца ўсе дадзеныя аб прыватным жыцці кліента (ці ёсць праца ў мужа, выхоўвае Ці кліент непаўналетніх дзяцей, адукацыя кліента і г.д.). А для таго каб вырашыць іншую задачу, звязаную з банкаўскай дзейнасцю, такія дадзеныя будуць зусім не істотныя. Значнасць дадзеных залежыць ад таго, што мы выбіраем ў якасці прадметнай вобласці.

У працэсе даследавання неабходна стварыць мадэль прадметнай вобласці. Веды з розных крыніц павінны быць фармалізаваны. Прадметная вобласць фармалізуе пры дапамозе якіх-небудзь сродкаў. Сродкі могуць быць самыя розныя. Гэта можа быць тэкставае апісанне прадметнай вобласці або спецыялізаваная графічная натацыя. З дапамогай мадэлі прадметнай вобласці апісваюцца працэсы, якія адбываюцца ў ёй, а таксама вывучаюцца дадзеныя гэтай галіне даследавання.

Пастаноўка задачы складаецца таксама з апісання статычнага і дынамічнага паводзін аб'ектаў, якія мы даследуем. Апісанне статычнага паводзін мяркуе характарыстыку аб'ектаў і іх уласцівасцяў. Пры апісанні дынамічнага паводзін характарызуюцца прычыны паводзін аб'ектаў.

Дынамічнае паводзіны аб'ектаў часта апісваюць разам са статычным паводзінамі.

Часам аналіз прадметнай вобласці і пастаноўка задачы аб'ядноўваюцца ў 1 этап.

На этапе вызначэння і аналізу патрабаванняў да дадзеных вырабляецца мадэляванне дадзеных, неабходных для ажыццяўлення Data Mining. Для гэтага даследуюцца пытанні размеркавання карыстальнікаў; аналітычныя характарыстыкі сістэмы; пытанні доступу да дадзеных, неабходным для аналізу.

Прадметная вобласць аналізуецца прасцей і больш эфектыўна, калі ў арганізацыі маецца сховішча дадзеных. Аднак далёка не на ўсіх прадпрыемствах ёсць такія сховішчы дадзеных. У такім выпадку крыніцай для зыходных дадзеных з'яўляюцца аператыўныя базы дадзеных, даведачныя і архіўныя матэрыялы, то ёсць дадзеныя з ужо існых ІС (інфармацыйных сістэм).

Яшчэ можа спатрэбіцца інфармацыя з ІС кіраўнікоў, знешніх і ўнутраных крыніц, розных дакументаў на папяровых носьбітах, а таксама веды спецыялістаў і / або вынікі апытанняў.

Неабходна таксама ведаць, што ў працэсе падрыхтоўкі дадзеных распрацоўшчыкі праграм павінны апісаць як мага больш фактараў, якія ўплываюць на працэс. Тут можа ажыццяўляцца кадаваньне некаторых дадзеных. Напрыклад, адна з характарыстык кліента - узровень яго даходу, які можа быць вызначаны як: вельмі нізкі, нізкі, сярэдні, высокі, вельмі высокі. У гэтым выпадку трэба вызначыць градацыі ўзроўню даходу.

Пры вызначэнні патрэбнага колькасці дадзеных неабходна ўлічваць ўпарадкаванасць дадзеных.

У тым выпадку, калі яны упарадкаваны, неабходна даведацца, ці ўключаная ў такой набор дадзеных сезонная / цыклічная кампанента. Калі ж яны не ўпарадкаваны, г.зн. набор падзей з базы дадзеных не звязаны па часовай шкале, то па ходзе збору трэба выконваць ніжэй прапісаныя правілы:

1) малы лік запісаў у базе дадзеных можа быць прычынай стварэння неадэкватнай мадэлі;

2) дакладнасць мадэлі можа быць палепшана з павелічэннем колькасці даных;

3) састарэлыя дадзеныя выключаюць з набору;

4) алгарытмы, якія выкарыстоўваецца ў мэтах стварэння мадэлі з прымяненнем вельмі вялікіх баз дадзеных, павінны мець магчымасць маштабавання.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.unansea.com. Theme powered by WordPress.