تخصص علم البيانات
ويُعرف علم البيانات بأنه "مفهوم قائم على توحيد الإحصاء، وتحليل البيانات وتعلم الآلة والوسائل المرتبطة بهم من أجل فهم وتحليل ظاهرة فعلية باستخدام البيانات".
وهو يقوم بتوظيف
نظريات وأساليب مستمدة من حقول معرفية متعددة في سياق الرياضيات والإحصاء وعلم
المعلومات وعلوم الحاسب.
و علم البيانات
هو عبارة عن خليط متميز يجمع بين مجموعة من التخصصات التي ترتبط ارتباط وثيق مع
البيانات والتكنولوجيا وتطوير الخوارزمية لحل المشكلات المعقدة بطريقة تحليلية،
فتعتبر البيانات أهم الجوانب التي يتم الاعتماد عليها في عصرنا الحالي، حيث تتضمن
أهمية كبيرة بعد تحليلها واستخراج كافة المعلومات التي يمكن استعمالها بطريقة
مفيدة، نظراً لاحتوائها على المعلومات الأولية التي يمكن تخزينها للاستفادة منها في
المؤسسات المختلفة.
التاريخ
مصطلح "علم
البيانات" (الذي استخدم في الأصل بالتبادل مع "Datalogy") موجود لأكثر من ثلاثين عاما، وكان
يستخدم في البداية كبديل عن علوم الكمبيوتر من قبل بيتر ناور في عام 1960.
حيث في عام
1974، نشر بيتر ناور مسح موجز لأساليب الكمبيوتر، والذي استخدم مصطلح "علم
البيانات" بحرية في دراسته لطرق معالجة البيانات المعاصرة التي تستخدم في
مجموعة واسعة من التطبيقات.
أقسام تخصص علم البيانات
يتميز تخصص علم
البيانات بكونه واحد من العلوم التي لا توجد ضمن تصنيفات أخرى، بل يتم تقسيمه إلى
مجموعة من الفروع تتعلق بتحليل البيانات كما يلي:
1-
قسم تطوير المنتجات المرتبطة بالبيانات
يعتمد هذا القسم
على البيانات التي تتضمنها الشركة كأحد المدخلات الرئيسية إلى الخوارزميات
والنماذج التي يقوم المختص بالبيانات بإدخالها وبنائها، فهناك اعتماد على وجود
خلفية ومعرفة واسعة للشخص بعلم الحاسوب، والذكاء الاصطناعي، وخوارزميات تعلم
الآلة.
2-
قسم اكتشاف وفهم البيانات
يختص هذا القسم
باكتشاف المعرفة التي تتضمنها البيانات لتوفير فرصة للأعمال لاتخاذ القرارات التي
تساهم بشكل كبير في الحصول على فائدة أكبر، ويقوم هذا القسم بالاعتماد على علم
الإحصاء وتحليل البيانات الكمي والنوعي.
وظائف علم البيانات
تتنوع مجالات
عمل ووظائف تخصص على البيانات ومن ابرزها ما يلى:
-
محلل بيانات
-
مهندس بيانات
-
عالم البيانات
-
مدير قاعدة البيانات
-
أخصائي قواعد البيانات
المهام الأساسية لعالم البيانات
على الرغم من أن
كل من محللي وعلماء البيانات يتشاركون العديد من الأهداف والمهام إلا أنه هناك بعض
الاختلافات.
هذه قائمة قصيرة
بأهم المهام والأهداف التي يعمل عليها
1-التنبؤ
بقيم معينة بناءً على بيانات قديمة.
•
التنبؤ بإجمالي الربح الذي سوف تحصل عليه الشركة خلال الشهر القادم.
•
التنبؤ بعدد المستخدمين الجدد للتطبيق في شهر معين.
2-عمليات
التصنيف | Classification
•
تصنيف البريد الإلكتروني بأنه غير هام أو هام.
3-بناء
أنظمة التوصية | Recommendation
Systems
•
عندما تقوم بعملية شراء لمنتج ما، سوف تلاحظ وجود قائمة تخبرك بمنتجات شبيه
بالمنتج الذي اخترته.
•
أنظمة التوصية في مواقع مشاهدة الأفلام.
4-
الكشف عن الأنماط | Pattern Detection
•اكتشاف
العلاقات بين البيانات الموجودة التي لا يمكن الكشف عنها بالطرق التقليدية.
5-التحليل
الاستكشافي للبيانات | Exploratory Data Analysis
•إجراء
بعض العمليات على البيانات لفهم طبيعتها والحصول على فكرة أولية عما تحتويه من
معلومات.
6-قياس جودة أداء الخوارزميات وتحسين نتائجها.
مراحل عملية علم البيانات
1-الحصول
على البيانات المتعلقة بالموضوع الذي تريد أن تكتشفه أو المشكلة المراد حلها.
2-معالجة
البيانات والتأكد من صحتها وخلوها من الأخطاء التي من الممكن أن تؤثر على النتائج.
3-القيام
بالتحليل الاستكشافي للبيانات للحصول على نظرة شاملة عن البيانات المتعامل معها.
4-بناء،
تطوير، وتطبيق الخوارزميات والنماذج اللازمة لحل المشكلة والحصول على النتائج.
5-عرض
النتائج النهائية على أصحاب القرار.ش
__________
موسوعة دروب المعرفية - سلسلة جامعتي