کاربردهای داده کاوی به زبان ساده

کاربردهای داده کاوی به زبان ساده

کاربردهای داده کاوی به زبان ساده

به مناسبت هفته فناوری اطلاعات همایشی در خصوص جایگاه IT در حوزه سلامت در دانشگاه جندی شاپور اهواز برگزار شد. دعوت شده بودم تا ارائه ای در خصوص هوش تجاری و داده کاوی داشته باشم. داده کاوی یکی از علایق شخصی من بوده و هست. سعی کردم از فرصتی که در اختیار دارم استفاده کنم و با زبانی ساده در مورد کاربردهایی که داده کاوی در علوم پزشکی دارد صحبت کنم. در این حوزه پژوهش ها و مقالات زیادی وجود دارد اما در عمل استفاده چندانی ( تا تاریخ این نوشته و در ایران) در محیط عملیاتی علوم پزشکی یعنی درمانگاه و بیمارستان ها مشاهده نمی شود و مدیران هم استقبالی از آن نکرده اند.

داده کاوی دو کارکرد اصلی دارد: پیش بینی رفتار آینده داده ها و توصیف و تفسیر الگوها

پیش بینی همیشه جزیی از آمال و آرزوهای انسان ها بوده و رد پای آن را در اسطوره ها و داستان ها می توانیم مشاهده کنیم. به همین دلیل فهم این کارکرد داده کاوی برای همه ساده است. اما کارکرد توصیفی داده کاوی که از دید من هیجان انگیز ترین بخش آن نیز هست کمی نیاز به توضیح و تفسیر دارد.

پیش از هرچیز باید دو پیش شرط اصلی برای تحقق صحیح کارکردهای داده کاوی را متذکر شوم. اگر انتظار استخراج دانش از داده کاوی داریم باید از:

  • صحیح بودن داده ها
  • داشتن عمق مناسب داده ها

خاطرجمع باشیم.

با فرض رعایت این دو پیش شرط، خروجی کارکرد توصیفی بصورت مجموعه ای از الگوهاست که تلازم بین داده ها را نمایان می کنند.

برای درک بیشتر این کارکرد و ملموس تر شدن روش کار داده کاوی یکی از پژوهش های انجام شده را مهندسی معکوس کردم. فرض کنید داده های ما مربوط به مادران باردار و وضعیت سلامت آنها در طول بارداری و تولد نوزاد است.

نتایجی زیر می توانند نمونه ای از کارکرد توصیفی داده کاوی باشند:

در مادران دارای گروه خونی A+ ، احتمال بیماری دوران بارداری نسبت به سایر گروه خونی بیش تر است.

بیماری دوران بارداری در زنانی که جنسیت نوزاد آنها دختر است، نسبت به جنسیت نوزاد پسر بیش تر است.

نکته مهم این نتایج این است که ما از ابتدا به دنبال اثبات یا کشف چنین روابطی نبوده ایم و اینجاست که داده کاوی راهش را از آنالیز آماری جدا می کند. نتایج حاصل از داده کاوی بدون هیچ پیش فرض اولیه ای در مورد داده ها استخراج شده اند در حالی که در آنالیزهای آماری ما همیشه بدنبال اثبات یک فرضیه هستیم.

دقت داشته باشید تلازم بین داده ها با رابطه علت و معلولی تفاوت دارد و نتایج را نباید بصورت علت و معلولی تفسیر کرد.

برچسب ها
اشتراک گذاری در :
امین برهمند
مشاور و مدرس کسب و کارها در حوزه فن آوری اطلاعات

مطالب مرتبط

ارسال دیدگاه