المملكة العربية السعودية
قـــــررت وزارة الـــتــعلـيــــم تــدريـــ�س هـــذا الــكــتــاب وطــبــعــه عــلــى نفقـتـها
علم البيانات التعليم الثانوي -نظام امل�سارات ال�سنة الثانية
طبعة 2022-1444
ح وزارة التعليم ١٤٤3 ،ه� فهرسة مكتبـة امللـك فهد الوطنيـة أثنـاء النـشـر
وزارة التعلـيـم علم البيانات -املرحلة الثانوية -نظام املسارات -السنة الثانية/ . وزارة التعليم -.الرياض 1443 ،هـ 25.5سم0 207ص ؛ . x 21 ردمـك 978-603-511-237-6 : 1ـ احلواسيب -تعليم -السعودية -2التعليم الثانوي -السعودية أ.العنوان 1٤٤3 / 1272٤ 00٤ ,,712 ديـوي 712
رقم االإيداع ١٤٤٢ / ١٢7٢٤ : ردمك 978-603-5١١-٢37-6 :
ﻣﻮاد إﺛﺮاﺋﻴﺔ وداﻋﻤﺔ ﻋﻠﻰ "ﻣﻨﺼﺔ ﻋﻴﻦ اﺛﺮاﺋﻴﺔ"
IEN.EDU.SA
ﺗﻮاﺻﻞ ﺑﻤﻘﺘﺮﺣﺎﺗﻚ ﻟﺘﻄﻮﻳﺮ اﻟﻜﺘﺎب اﻟﻤﺪرﺳﻲ
FB.T4EDU.COM
ش النا� :ش�كة تطوير للخدمات التعليمية ب� ش�كة Binary Logic SAش تم ش الن� بموجب اتفاقية خاصة ي ن و�كة تطوير للخدمات التعليمية ن (عقد رقم )2022/0003لالستخدام ي� المملكة العربية السعودية حقوق ش الن� © Binary Logic SA 2022 .ال يجوز نسخ أي جزء من هذا المنشور أو تخزينه ن� أنظمة ت اس�جاع البيانات أو جميع الحقوق محفوظة ي ئ ت نقله بأي شكل أو بأي وسيلة إلك�ونية أو ميكانيكية أو بالنسخ كتا� الضو� أو التسجيل أو ي غ� ذلك دون إذن ب ي ي من ش النا�ين. ُ :يحتوي هــذا الكتاب عىل روابــط إىل مواقع ت إلك�ونية ال تــدار من قبل ش�كــة Binary ُيـ ب ـر� مالحظة ما يـ يـىل َّ .Logicورغم أن ش�كة Binary Logicتبذل قصارى جهدها لضمان دقة هذه الروابط وحداثتها ومالءمتها، إال أنها ال تتحمل المسؤولية عن محتوى أي مواقع ت إلك�ونية خارجية. إشعار بالعالمات التجارية :أسماء المنتجات أو ش ال�كات المذكورة هنا قد تكون عالمات تجارية أو عالمات ُ ن ُ َّ تن� تـجــاريــة مسجلة وتستخدم فقط بـغــرض التعريف والتوضيح ولـيــس هـنــاك أي نية النـتـهــاك الـحـقــوق .ي ش ين المعني�. ـ� الـعــالمــات الـتـجــاريــة ُ�ك ــة Binary Logicوج ــود أي ارت ـبــاط أو رعــايــة أو تأييد مــن جــانــب مــالـ ُ ي تعد Excelعالمة تجارية ُم َّ سجلة لـ شـ�كــة .Microsoft Corporationتعد Tinkercadعالمة تجارية ُ ُم َّ سجلة لـ شـ�كــة .Autodesk Incتـعــد “ ”Pythonوش ـعــارات Pythonعــالمــات تـجــاريــة مسجلة ش ل�كة ُ ُ .Python Software Foundationتعد Jupyterعالمة تجارية ُم َّ سجلة ش ل�كة .Project Jupyterتعد ل�كة ُ .JetBrains s.r.oتعد Multisim Liveعالمة تجارية ُم َّ PyCharmعالمة تجارية ُم َّ سجلة ش سجلة ُ لـ شـ�كــة .National Instruments Corporationتـعــد CupCarbonعــالمــة تـجــاريــة ُمـسـ َّـجـلــة لـ شـ�كــة ُ ُ .CupCarbonتعد Arduinoعالمة تجارية ُم َّ سجلة ش ل�كة .Arduino SAتعد Micro:bitعالمة تجارية ُم َّ سجلة ش ل�كة .Micro:bit Educational Foundation وال ترىع ش ال�كات أو المنظمات المذكورة أعاله هذا الكتاب أو ترصح به أو تصادق عليه. النا� جاهدا تتبع مالك الحقوق الفكرية كافة ،وإذا كان قد سقط اسم ٍّ ً حاول ش سهوا فسيكون من أي منهم ن دواىع �ور ش التداب� الالزمة ي� أقرب فرصة. النا� اتخاذ ي ي
مقدمة اإن تق��دم ال��دول وتطوره��ا يقا���ص مب��دى قدرته��ا عل��ى ال�س��تثمار يف التعلي��م ،وم��دى ا�س��تجابة نظامه��ا التعليم��ي ملتطلب��ات الع�س��ر ومتغريات��ه .وحر�س� ًا م��ن وزارة التعلي��م عل��ى دميوم��ة تطوي��ر اأنظمته��ا التعليمية ،وا�س��تجابة لروؤية اململكة العربية ال�س��عودية 2030فقد بادرت الوزارة اإىل اعتماد نظام «م�س��ارات التعليم الثانوي» بهدف اإحداث تغيري فاعل و�س��امل يف املرحلة الثانوية. اإن نظ��ام م�س��ارات التعلي��م الثان��وي يق��دم اأمنوذج� ًا تعليمي� ًا متمي��ز ًا وحديث� ًا للتعلي��م الثان��وي باململك��ة العربي��ة ال�س��عودية ي�س��هم بكف��اءة يف: تعزي��ز قي��م النتم��اء لوطنن��ا اململك��ة العربي��ة ال�س��عودية ،والولء لقيادته الر�س��يدة حفظه��م اهلل ،انطالق ًا من عقيدة �سافية م�ستندة على التعاليم الإ�سالمية ال�سمحة. تعزيز قيم املواطنة من خالل الرتكيز عليها يف املواد الدرا�سية والأن�سطة ،ات�ساق ًا مع مطالب التنمية امل�ستدامة ،واخلطط التنموية يف اململكة العربية ال�سعودية التي توؤكد على تر�سيخ ثنائية القيم والهوية ،والقائمة على تعاليم الإ�سالم والو�سطية. تاأهي��ل الطلب��ة مب��ا يتواف��ق م��ع التخ�س�س��ات امل�س��تقبلية يف اجلامعات والكليات اأو املهن املطلوبة؛ ل�سمان ات�س��اق خمرجات التعليم مع متطلبات �سوق العمل. متكني الطلبة من متابعة التعليم يف امل�سار املف�سل لديهم يف مراحل مبكرة ،وفق ميولهم وقدراتهم. متكني الطلبة من اللتحاق بالتخ�س�سات العلمية والإدارية النوعية املرتبطة ب�سوق العمل ،ووظائف امل�ستقبل. دم��ج الطلب��ة يف بيئ��ة تعليمي��ة ممتع��ة وحمف��زة داخ��ل املدر�س��ة قائم��ة عل��ى فل�س��فة بنائية ،وممار�س��ات تطبيقي��ة �سمن مناخ تعليمي ن�سط. نق��ل الطلب��ة ع��رب رحل��ة تعليمي��ة متكامل��ة ب��د ًءا م��ن املرحل��ة البتدائي��ة حت��ى نهاي��ة املرحل��ة الثانوية ،وتُ�س� ِّهل عملي��ة انتقالهم اإىل مرحل��ة م��ا بعد التعليم العام. تزويد الطلبة باملهارات التقنية وال�سخ�سية التي ت�ساعدهم على التعامل مع احلياة ،والتجاوب مع متطلبات املرحلة. تو�س��يع الفر���ص اأم��ام الطلب��ة اخلريج��ني ع��رب خي��ارات متنوع��ة اإ�ساف��ة اإىل اجلامعات مثل :احل�سول على �س��هادات مهنية، واللتحاق بالكليات التطبيقية ،واحل�سول على دبلومات وظيفية. ويتكون نظام امل�سارات من ت�سعة ف�سول درا�سية تُد ّر�ص يف ثالث �سنوات ،تت�سمن �سنة اأوىل م�سرتكة يتلقى فيها الطلبة الدرو�ص يف جمالت علمية واإن�سانية متنوعة ،تليها �سنتان تخ�س�سيتانُ ،ي�س ّكن الطلبة بها يف م�سار عام واأربعة م�سارات تخ�س�سية تت�سق مع ميولهم وقدراتهم ،وهي :امل�سار ال�سرعي ،م�سار اإدارة الأعمال ،م�سار علوم احلا�سب والهند�سة ،م�سار ال�سحة واحلياة ،وهو ما يجعل هذا النظام هو الأف�سل للطلبة من حيث: وج��ود م��واد درا�س��ية جدي��دة تتواف��ق م��ع متطلب��ات الث��ورة ال�سناعي��ة الرابع��ة واخلط��ط التنموي��ة ،وروؤي��ة اململك��ة ،2030 ته��دف لتنمي��ة مه��ارات التفك��ري العلي��ا وح��ل امل�س��كالت ،وامله��ارات البحثي��ة. برام��ج املج��ال الختي��اري الت��ي تت�س��ق م��ع احتياج��ات �س��وق العم��ل ومي��ول الطالب ،حي��ث ُمي ّكن الطلبة م��ن اللتحاق مبجال اختي��اري حم��دد وفق م�سفوفة مهارات وظيفية حمددة. مقيا���ص مي��ول ي�سم��ن حتقي��ق كف��اءة الطلب��ة وفاعليته��م ،وي�س��اعدهم يف حتديد اتاهاتهم وميولهم ،وك�س��ف مكامن القوة لديهم ،مما يعزز من فر�ص جناحهم يف امل�ستقبل. العم��ل التطوع��ي امل�سم��م للطلب��ة خ�سي�س� ًا مب��ا يت�س��ق م��ع فل�س��فة الن�س��اط يف املدار���ص ،ويع��د اأح��د متطلب��ات التخرج؛ مما ي�س��اعد على تعزيز القيم الإن�س��انية ،وبناء املجتمع وتنميته ومتا�س��كه. التج�سري الذي ميكن الطلبة من النتقال من م�سار اإىل اآخر وفق اآليات حمددة. ح�س���ص الإتق��ان الت��ي يت��م م��ن خالله��ا تطوي��ر امله��ارات وحت�س��ني امل�س��توى التح�سيل��ي ،م��ن خ��الل تق��دمي ح�س���ص اإتق��ان اإثرائي��ة وعالجية. 4
خي��ارات التعلي��م املدم��ج ،والتعل��م ع��ن بع��د ،وال��ذي ُبن��ي يف نظ��ام امل�س��ارات عل��ى اأ�س���ص م��ن املرون��ة ،واملالءم��ة والتفاع��ل والفعالي��ة. م�سروع التخرج الذي ي�ساعد الطلبة على دمج اخلربات النظرية مع املمار�سات التطبيقية. مهام حمددة ،واختبارات معينة بال�سراكة مع جهات تخ�س�سية. �سهادات مهنية ومهارية متنح للطلبة بعد اإجنازهم َّ وبالت��ايل ف�اإن م�س � ��ار عل � ��وم احلا�س � ��ب والهند�س � ��ة كاأح��د امل�س � ��ارات امل�س � ��تحدثة ف � ��ي املرحل��ة الثانوي � ��ة ي�س � ��هم ف � ��ي حتقي � ��ق اأف�سل املمار�سات عرب ال�ستثمار يف راأ�ص املال الب�س ��ري ،وحتوي ��ل الطالب اإل ��ى فرد م�س ��ارك ومنت ��ج للعل ��وم واملعارف ،مع اإك�س ��ابه امله � ��ارات واخلربات الالزمة ل�ستكمال درا�س � ��ته يف تخ�س�س � ��ات تتنا�س � ��ب مع ميول � ��ه وقدراته اأو اللتحاق ب�س � ��وق العم � ��ل. وتع��د م��ادة عل��م البيان��ات اإح��دى امل��واد الرئي�س��ة يف م�س��ار عل��وم احلا�س��ب والهند�س��ة الت��ي ت�س��هم يف تو�سي��ح ماهي��ة البيان��ات واأ�س��اليب حتليلها مبا ي�س��اعد على ال�س��تفادة منها يف فهم الواقع واتخاذ قرارات م�س��تنرية والقيام بتوقعات نافعة للم�س��تقبل يف عدة جم��الت حياتي��ة .وته��دف امل��ادة اإىل تعري��ف الطلب��ة باأهمي��ة البيان��ات وطرق جمعها وتقييمها وكيفية ال�س��تفادة منها يف حل امل�س��كالت احلياتية ،ودورها يف اتخاذ القرارات على امل�س��توى ال�س��خ�سي واملجتمعي مع التعريف بال�سيا�س��ات والت�س��ريعات املتعلقة بال�س��تخدام الآم��ن والأخالق��ي للبيان��ات .وكذل��ك ترك��ز عل��ى تعزي��ز مهارات التفكري احلا�س��وبي من خالل التعامل مع البيانات كمورد اأ�سا�س��ي متاح ميكن ال�ستفادة منه ،كما تبني هذه املادة اأهمية البيانات ال�سخمة ،وطرق حتليلها ،وت�سنيفها ،وخ�سائ�سها ،وم�سادرها ،وتقنياتها، وتطبيقاته��ا ،وجم��الت ال�س��تفادة منه��ا يف املج��ال التعليم��ي والقت�س��ادي ،والتعري��ف بخوارزمي��ات ال��ذكاء ال�سطناع��ي وتعل��م الآل��ة ودوره��ا يف منظوم��ة البيان��ات .كم��ا ت�س��تمل ه��ذه امل��ادة عل��ى اأعم��ال تطبيقي��ة مل��ا يتعلم��ه الطلب��ة؛ حل��ل م�س��اكل واقعي��ة حتاك��ي م�س��توياته املعرفي��ة ،بتوجي��ه واإ�س��راف من املعلم. ويتميز كتاب علم البيانات باأ�ساليب حديثة ،تتوافر فيه عنا�سر اجلذب والت�سويق ،والتي تعل الطلبة يقبلون على تعلمه والتفاعل معه ،من خالل ما يقدمه من تدريبات واأن�سطة متنوعة ،كما يوؤكد هذا الكتاب على جوانب مهمة يف تعليم علم البيانات وتعلمه ،تتمثل يف: الرتابط الوثيق بني املحتويات واملواقف وامل�سكالت احلياتية. تنوع طرائق عر�ص املحتوى ب�سورة جذابة وم�سوقة. اإبراز دور املتعلم يف عمليات التعليم والتعلم. الهتمام برتابط حمتوياته مما يجعل منه ك ًال متكام ًال. الهتمام بتوظيف التقنيات املنا�سبة يف املواقف املختلفة. الهتمام بتوظيف اأ�ساليب متنوعة يف تقومي الطلبة مبا يتنا�سب مع الفروق الفردية بينهم. وملواكبة التطورات العاملية يف هذا املجال ،فاإن كتاب مادة علم البيانات �سوف يوفر للمعلم جمموعة متكاملة من املواد التعليمية املتنوعة التي تراعي الفروق الفردية بني الطلبة ،بالإ�سافة اإىل الربجميات واملواقع التعليمية ،التي توفر للطلبة فر�سة توظيف التقنيات احلديثة والتوا�سل املبني على املمار�سة؛ مما يوؤكد دوره يف عملية التعليم والتعلم. ونح��ن اإذ نق��دم ه��ذا الكت��اب لأعزائن��ا الطلب��ة ،ناأم��ل اأن ي�س��تحوذ عل��ى اهتمامه��م ،و ُيلب��ي متطلباته��م ،ويجع��ل تع ّلمه��م له��ذه امل��ادة اأكرث متعة وفائدة.
واهلل ويل التوفيق
5
الفهر�س .1مقدمة في علم البيانات 8 ......... الدر�س االأول البيانات والمعل�مات والمعرفة 9 ......................... تمرينات 17 ................................................ الدر�س الثاني التعامل مع البيانات 21 .................................... تمرينات29 .............................................................
الدر�س الثالث اأ�سا�سيات علم البيانات 34 ................................. تمرينات 39 ................................................ الم�سروع43 ................................................
.2جمع البيانات والتحقق من �سحتها46 .................... الدر�س االأول جمع البيانات47 ........................................... تمرينات 53 ................................................ الدر�س الثاني اأن�اع البيانات57 ........................................... تمرينات 62 ................................................ الدر�س الثالث التحقق من �سحة اإدخال البيانات 65 .................... تمرينات 89 ................................................ الم�سروع92 ................................................
.3التحليل اال�ستك�سافي للبيانات 94 ..................... الدر�س االأول تحليل البيانات95 ......................................... تمرينات 105 ............................................... الدر�س الثاني مكتبات البايث�ن لتحليل البيانات108 .................... تمرينات 127 ............................................... الدر�س الثالث ت�س�ير البيانات 130 ....................................... تمرينات 139 ............................................... الم�سروع142 ...............................................
.4نمذجة البيانات التنبوؤية ُّ والتوقع 144 .................... الدر�س االأول نمذجة البيانات التنب�ؤية 145 ............................. تمرينات 157 ............................................... الدر�س الثاني الت� ُّقع (160 ...............................)Forecasting تمرينات 182 ............................................... الدر�س الثالث التح�سين (185 .......................... )Optimization تمرينات 202 ............................................... الم�سروع205 ...............................................
7
.1مقدمة يف علم البيانات �يتعرف الطال��ب يف ه��ذه الوح��دة عل��ى املفاهي��م االأ�سا�س��ية لعل��م البيان��ات، �س� ّ وي�سمل ذلك تعريف معنى البيانات واملعلومات واملعرفة والفرق بينهم ،و�سيتم تناول مو�سوع دورة حياة علم البيانات و طريقة التعامل مع البيانات ال�سخمة، وا ً أي�سا �سيتم مناق�سة بع�س املو�سوعات اخلا�سة بال�سيا�سات املتعلقة بالبيانات وحوكمة البيانات. �يتعرف الطال��ب عل��ى اأ�سا�س��يات عل��م البيان��ات م��ع الرتكي��ز على ويف اخلت��ام �س� ّ الفر���س الوظيفية الت��ي يوفرها علم البيانات.
اأهداف التعلم بنهاية هذه الوحدة �سيكون الطالب قاد ًرا على اأن: يعرف م�سطلح علم البيانات. ّ يفرق بني البيانات واملعلومات واملعرفة. ّ يفرق بني علم البيانات وذكاء االأعمال. ّ ّ يو�سح اأوجه التقارب بني علم البيانات والذكاء اال�سطناعي. ُيحدد مراحل دورة حياة علم البيانات. يعرف م�سطلح البيانات ال�سخمة. ّ ُيحدد خ�سائ�س البيانات ال�سخمة. ي�سنّف تقنيات البيانات ال�سخمة. يعرف مفهوم اإدارة البيانات. ّ يحدد مبادئ حوكمة البيانات. ُيناق�س املهارات واالأدوات التي يتطلبها علم البيانات. ُيحدد املهن املتعلقة بعلم البيانات. ّ يو�سح اأهمية املجتمعات الرقمية لعلم البيانات.
متطلب الربجمة بلغة البايثون يتطل��ب منهج��ي عل��م البيان��ات والهند�س��ة يف نظ��ام امل�س��ارات معرف��ة اأ�سا�س��يات الربجم��ة بلغ��ة البايثون .يرجى م�س��ح رمز ال�س��تجابة ال�س��ريع اأدناه للو�سول ملحتوى تعريفي بالبايثون .وملعرفة املو�سوع��ات املتوف��رة والو�س��ول ال�س��ريع لكل وحدة ،ميكن��ك الطالع على ال�سفحات .209-208 8
الدر�س االأول
البيانات واملعلومات واملعرفة علم البيانات
Data Science
تكم��ن اأهمي��ة عل��م البيان��ات ( )Data Scienceيف اأن البيان��ات اأ�سبح��ت ج��ز ًءا اأ�سا�س � ًيا يف جمي��ع رئي�سا من ِقبل ال�سركات لكي تتو�سع اأعمالها وتتطور .حيث ال�سناعات ،فلقد اأ�سبحت البيانات مطل ًبا ً مت ّكن الأ�ساليب القائمة على البيانات ال�سركات ِمن اتخاذ القرارات املنا�سبة وذلك من خالل حتليل كميات كبرية من البيانات ل�س��تخراج روؤى وتو�سيات ق ِّيمة لإدارة تلك ال�س��ركات. جماالت تطبيق علم البيانات التطبيقات التجارية وال�سناعية. الرعاية ال�سحية ،واملعل�ماتية احلي�ية ،والعل�م الطبيعية. االقت�ساد الرقمي ،وحتليل و�سائل الت�ا�سل االجتماعي ،وال�سبكات االجتماعية. املنازل الذكية ،واملدن الذكية ،وامل�ا�سالت الذكية.
الطاقة ،واال�ستدامة ،واملناخ.
Data and Information
حتي��ط ب��ك البيان��ات ب�س��ورة يومي��ة يف كل م��كان ،فتتلقى املعلومات م��ن التلفاز ومن ال�سحف والكتب و�سبكة الإنرتنت ،ولكن هل فكرت يف اأن هناك فر ًقا بني البيانات واملعلومات؟ ُتع� ُّد البيان��ات متثي� ً�ال للحقائ��ق اأو الأف��كار ب�س��ورة �س��كلية ،بحي��ث ميكن اإي�ساله��ا اأو معاجلتها م��ن خ��الل طريق��ة اأو عملي��ة م��ا .فعل��ى �س��بيل املثال ،يعر�ص ال�س��كل 1.1جمموعة من البيانات ال�سخ�سية لأحد الطلبة. عندم��ا تت��م معاجل��ة البيان��ات ،اأو تنظيمه��ا ،اأو حتليله��ا ،اأو تقدميه��ا يف �س��ياق مع��ني لتك��ون مفي��دة وذات معن��ى ،فاإنه��ا تُ�سب��ح معلوم��ات .فعل��ى �س��بيل املث��ال ،يعر�ص ال�س��كل 1.2معلومات ّ منظمة عن طالب ما ،وميكنك اأن تالحظ هنا وجود معلومات حول الطالب مثل ا�سمه وعنوان املن��زل والهاتف والربي��د الإلكرتوين وتاريخ امليالد. بطاقة طالب *** *** **05
[email protected]
اال�سم :محمد عنوان المنزل� 14 :سارع بدر. رقم الهاتف05** *** *** : البريد االإلكتروني:
ال�ساد�س ع�سر من اأبريل
[email protected]
محمد � 14سارع بدر.
مثال تط ّب��ق من�س��ة ا�ست�س��راف ()Estishraf التابع��ة ملرك��ز املعل�م��ات ال�طن��ي ()NIC
التعليم والتع ّلم االإلكرتوين والرتفيه.
البيانات واملعلومات
علم البيانات (:)Data Science عل��م البيان��ات ه��و جم��ال الدرا�س��ة ال��ذي يتعام��ل م��ع كمي��ات هائل��ة م��ن البيان��ات با�س��تخدام الأدوات والتقني��ات احلديث��ة لإيج��اد اأمن��اط غ��ري بديهي��ة داخ��ل تل��ك البيان��ات ،وللو�س��ول اإىل معلوم��ات مه ّم��ة ميكن اأن ت�ساهم يف اتخاذ القرارات املتعلقة بكاف��ة الأعم��ال.
تقني��ات عل��م البيان��ات املتقدم��ة عل��ى قاع��دة بياناته��ا لتق��دمي روؤى وتنب ��ؤات م�س��تقبلية باأك��ر م��ن � 50س��يناري� لدع��م ُ�س ّن��اع الق��رار يف اململك��ة.
البيانات: متثي��ل احلقائ��ق اأو الأفكار بتن�س��يق منا�س��ب للتخزين اأو املعاجلة اأو النقل. املعل�مات: جمموع��ة م��ن البيان��ات الت��ي خ�سع��ت للمعاجل��ة واأ�سبح��ت ّ منظم��ة ذات معن��ى وتق �دّم يف �س��ياق حم��دد ومفي��د ُومت ّك��ن عملي��ات �سن��ع الق��رار.
تاريخ الميالد :ال�ساد�س ع�سر من اأبريل
�سكل :1.1بيانات غري ّ منظمة
�سكل :1.2معلومات
9
البيانات االأولية واملعلومات
Raw Data and Information
تطل��ق ت�س��مية البيان��ات الأولي��ة عل��ى البيان��ات الت��ي مت جمعه��ا حدي ًث��ا م��ن م�س��ادر خمتلف��ة ،ولك��ن مل يت��م معاجلته��ا اأو حتليله��ا بع��د ب�اأي �س��كل من الأ�س��كال، وع��ادة م��ا ترم��ز كلم��ة البيان��ات ( )Dataاإىل البيان��ات الأولي��ة ،ولك��ن مبج��رد حتليلها فاإنها تتح��ول اإىل معلومات. لت�ساهد بع�ص الأمثلة: يعترب الرقم " "8122001بيانات اأولية باعتباره قيمة لي�ست ذات معنى �سياقي ،ولكن اإذا مت عر�ص هذه القيمة ب�سورة تاريخ ميالد هو "،"8/12/2001 اأ�سبحت معلومات ،وذلك لتوفريها معرفة حول اأمر معني ،وهو تاريخ ميالد �سخ�ص ما. ُمت ّث��ل نتيج��ة اختب��ار كل طال��ب جزئي� ًة واح��دة م��ن البيان��ات ،بينم��ا ُيع� ُّد متو�س��ط درج��ات الف�سل الدرا�س��ي اأو املدر�س��ة باأكملها معلومات مت ا�س��تقاقها من البيانات املوجودة.
معلومات للمزيد من املعاجلة
Information for Further Processing
ميك��ن دم��ج البيان��ات و املعلوم��ات م��ن م�س��ادر خمتلف��ة لإن�س��اء جمموع��ات بيان��ات ذات اأث��ر اأك��رب ،و ُيطل��ق عل��ى ه��ذه العملي��ة ا�س��م دم��ج البيان��ات (.)Data Blending ميكنك على �س��بيل املثال دمج جمموعة من املعلومات من اأق�س��ام الت�س��ويق واملبيعات لتحديد احلمالت الت�س��ويقية الأكرث تاأث ًريا وحتقي ًقا لالأرباح ملجموعة من املنتجات. جدول :1.1اأوجه االختالف بني البيانات واملعلومات املعلومات
البيانات غري ّ منظمة.
ّ منظمة منطق ًيا.
يتم عر�سها على �س�رة اأرقام ،ر�س�مات ،اأو اإح�سائيات.
يتم تقدميها من خالل التقارير والر�س�م البيانية اأو املخططات.
م�ستقلة بذاتها.
تعتمد على البيانات.
يتم احل�س�ل عليها من مدخالت امل�ستخدمن اأو من مدخالت حم��سبة.
يتم احل�س�ل عليها من عمليات معاجلة البيانات.
املعرفة
Knowledge
�كل اأ�سا���ص جمموع��ة م��ن املعلوم��ات يت��م ا�س��تخدامها لتق��دمي فائدة اأو حتقي��ق غر�ص معني .ميكن��ك القول اأن تعت��رب املعرف��ة متثي� ً�ال لفهم��ك للع��امل ،وه��ي ب�س� ٍ فهم ال�سخ�ص لبع�ص املعلومات حول �سيء ما يوفر لديه معرفة به ،فت�سبح املعلومات معرفة عند تطبيق عمليات التفكري النقدي ،اأو التقييم ،اأو التخطيط، اأو التنظيم. لت�س��اهد املثال يف ال�س��كل ،1.3ميكنك مالحظة اأن البيانات املوجودة اأ�س��فل املخطط هي قائمة من الكلمات التي تخلو من اأي �س��ياق ،واإذا مت تنظيم هذه البيان��ات وترتيبه��ا ،ف ُيمك��ن توف��ري بع���ص املعلوم��ات .وعل��ى فر���ص اأن ه��ذه القائم��ة حتت��وي على نتائج مبيع��ات نكهات املثلجات يف اليوم ال�س��ابق ،ميكنك من خالل اإجراء بع�ص عمليات التحليل عليها اأن حت�سل على بع�ص املعلومات املفيدةً ، فمثال ميكنك اأن تدرك اأن نكهة ال�س��وكولتة هي الأكرث مبي ًعا. رواجا ،وهكذا ميكنه اأن يطلب خم�سة اأ�سعاف كمية املثلجات بنكهة ال�سوكولتة ُمت ّكنُ املعرفة هنا مدير املتجر من اكت�ساف اأن نكهة ال�سوكولتة هي الأكرث ً يف امل��رة القادم��ة مقارن��ة بالنكه��ات الأخرى مثل نكهة القهوة (.)Mocha 10
قائمة الطلبات قهوة ()Mocha
kg 1
�سوكولتة
kg 5
املعرفة مبيعات اأطعم المثلجات قهوة ()Mocha
فانيال �سوكولتة فراولة
املعلومات قهوة ()Mocha
�سوكولتة فانيال فراولة �سوكولتة
البيانات
فانيليا �سوكولتة �سوكولتة فانيليا �سوكولتة
�سكل :1.3هرم البيانات -املعلومات -املعرفة
جدول :1.2اأوجه االختالف بني املعلومات واملعرفة املعلومات املعنى
بيانات متت معاجلتها لت�سبح ذات �سياق مفه�م.
القدرة على التنبوؤ ال تكفي وحدها للت��سل اإىل ا�ستنتاجات اأو قرارات.
املعرفة ا�ستنتاجات م�ستقاة من املعل�مات ت�ساعد يف اتخاذ القرارات. ت�ساهم يف القدرة على التنب�ؤ واتخاذ القرارات.
ميكن اإي�سالها ب�سه�لة من خالل الطرق ال�سف�ية اأو ال�رقية اأو االإلكرتونية.
تتطلب ِّ اطالع بامل��س�ع املحدد.
النتائج
ينتج عنها الفهم.
ينتج عنها االإدراك.
الهدف
جتيب على اأ�سئلة مثل مَن ومتى وماذا واأين.
جتيب على اأ�سئلة مثل كيف وملاذا.
اإي�سال النتائج لالآخرين
11
علم البيانات وذكاء االأعمال Data Science versus Business Intelligence
توج��د البيان��ات يف كل م��كان م��ن حول��ك ،ويت��م ا�س��تخدامها ومعاجلته��ا وحتليله��ا يف جمي��ع جم��الت �كل خا���ص يف العدي��د م��ن احلي��اة .تتط��ور نوعي��ة البيان��ات وا�س��تخداماتها با�س��تمرار ،وتُ�س��تخدم ب�س� ٍ التطبيق��ات املهم��ة مث��ل ذكاء االأعم��ال ( ،)Business Intelligenceوله��ذا ُيعت��رب ذكاء الأعمال عملية قائم��ة عل��ى التقني��ة لتحلي��ل البيان��ات وتوف��ري معلوم��ات مهمة ت�س��اعد امل��دراء التنفيذي��ن وغريهم من امل�س�وؤولني و�س َّن��اع الق��رار عل��ى اتخ��اذ ق��رارات دقيق��ة خا�س��ة بالأعم��ال .وعل��ى الرغم م��ن اأن ً كال من عل��م البيان��ات وذكاء الأعم��ال يت�سم��ن العم��ل عل��ى البيان��ات ،اإل اأنهما يختلف��ان عن بع�سهما. ُيع ُّد علم البيانات اأكرث تعقيدً ا مقارنة بذكاء الأعمال ،حيث يقت�سر نطاق ذكاء الأعمال على جمال الأعمال ،ويتم فيه حتليل البيانات ال�سابقة من خالل تطوير لوحات املعلومات وعر�ص م�ستخل�سات (روؤى) الأعمال ،وكذلك ترتيب و تنظيم وحتليل البيانات وذلك ل�ستخراج املعلومات التي من �ساأنها م�س��اعدة ال�س��ركات على النمو وحتقيق اأهدافها بناء على فهم التاهات احلالية لالأعمال .ويعتمد علم البيانات على ا�ستخدام البيانات املتوفرة للقيام بتنبوؤات م�ستقبلية وعر�ص توقعات منو الأعمال التجارية ،وذلك بتوظيف جمموعة وا�س��عة مما ي�س��مى بالنماذج التنبوؤية واخلوارزميات الإح�سائية املعقدة. يتمث��ل ال��دور الأ�سا�س��ي لأدوات ذكاء الأعم��ال يف حتلي��ل معلوم��ات املوؤ�س�س��ات وال�س��ركات وامل�س��اهمة يف اإع��داد ا�س��رتاتيجيات الأعم��ال ،اأم��ا اأدوات ع��امل البيانات فت�س��مل اأدوات معاجلة البيانات واأدوات البيان��ات ال�سخم��ة وكذل��ك من��اذج خوارزمي��ة معقدة لتحليل البيانات وا�س��تخال�ص التو�سيات.
ذكاء االأعمال (:)Business Intelligence
ه��و نظ��ام مبن��ي عل��ى البيان��ات وي�س��مل جم��ع وتخزي��ن وحتلي��ل ومتثي��ل البيان��ات لدع��م عملي��ات اتخ��اذ الق��رارات.
جدول :1.3اأوجه االختالف بني علم البيانات وذكاء االأعمال علم البيانات ُت�ستخدم البيانات لعمل تنب�ؤات م�ستقبلية لتط�ير االأعمال.
ُحتلل البيانات ال�سابقة ال�ستنتاج االجتاهات احلالية لالأعمال.
يت�سمن مناذج ح�سابية معقدة ومعاجلة البيانات و اأدوات البيانات ال�سخمة.
تقت�سر االأدوات على حتليل املعل�مات االإدارية واالإ�سراف على ا�سرتاتيجيات االأعمال.
املنظمة و�سبه ّ تتعامل ب�سكل اأ�سا�سي مع البيانات غري ّ املنظمة، وميكنها كذلك التعامل مع البيانات ّ املنظمة.
تتعامل مع البيانات ّ املنظمة التي يتم تخزينها عاد ًة يف م�ست�دعات البيانات.
التعقيد
اأكر تعقيدًا مقارنة بذكاء االأعمال.
اأب�سط بكثري مقارنة بعلم البيانات.
املرونة
اأكر مرونة حيث ميكن اإ�سافة م�سادر البيانات ح�سب احلاجة.
اأقل مرونة حيث يجب ت�سميم م�سادر البيانات م�سبقًا.
املدى
االأدوات
اأنواع البيانات
12
ذكاء االأعمال
علم البيانات والذكاء اال�سطناعي Data Science and Artificial Intelligence
كما تعرفت �ساب ًقا على مفهوم علم البيانات ،فاإن جمال الذكاء اال�سطناعي ()Artificial Intelligence كم كبري من البيانات. ُيع� ُّد جم� ً�ال اآخ��ر يتعام��ل مع ٍ ميك��ن ا�س��تخدام كل تقني��ة م��ن هات��ني التقنيت��ني ب�س��ورة منف�سل��ة ع��ن الأخ��رى للو�س��ول حلل��ول لتحدي��ات �كل منهما اإكم��ال بع�سهما والتقارب م ًعا. خمتلف��ة ،كذل��ك ميك��ن ل� ٍ يخت���ص عل��م البيان��ات مبعاجل��ة البيان��ات التاريخي��ة با�س��تخدام اأدوات ح�س��ابية للقي��ام مب��ا ي�س��مى بالتحلي��ل ال��سف��ي للبيان��ات ( )Descriptive Analysisوال��ذي يق��دم و�س ًف��ا للمواق��ف املح��ددة ،وكذل��ك للتنب �وؤ بالنتائ��ج م��ن خ��الل التحلي��ل التنب ��ؤي ( ،)Predictive Analysisولتق��دمي احلل��ول والتو�سي��ات �تخداما للم�س��كالت م��ن خ��الل التحلي��ل الت�جيه��ي ( .)Prescriptive Analysisم��ن اأك��رث الأدوات ا�س� ً ه��ي الأدوات الإح�سائي��ة والإداري��ة الت��ي ميك��ن بوا�س��طتها حتلي��ل البيان��ات املوؤرخ��ة .وم��ن ناحي��ة اأخ��رى ي�ستخدم الذكاء ال�سطناعي جمموعة متنوعة من التقنيات ملحاكاة الطريقة التي يفكر بها الب�سر والتي يقوم��ون بن��اء عليه��ا باتخ��اذ الق��رارات وحتليله��ا ،فب� ً �دل م��ن الرتكي��ز عل��ى اإج��راء احل�س��ابات الريا�سي��ة، يت��م الرتكي��ز عن��د ا�س��تخدام اأدوات ال��ذكاء ال�سطناع��ي عل��ى عنا�س��ر املعرف��ة وال��ذكاء كعنا�س��ر حا�س��مة حل��ل امل�س��كالت .ويهت��م ال��ذكاء ال�سطناع��ي كذل��ك باحل��س��بة املعرفي��ة (.)Cognitive Computing ومن املهم الإ�س��ارة اإىل اأن الفروقات التي ُذكرت �س��اب ًقا بني علم البيانات والذكاء ال�سطناعي تبدو اأقل و�سوح��ا يف ال�س��تخدامات العملي��ة لهم��ا لأن م�س��روعات عل��م البيان��ات املعقدة غال ًبا ما تت�سمن ا�س��تخدام ً تقنيات تع ّلم الآلة -اأحد فروع الذكاء ال�سطناعي -لت�سهيل حتليل البيانات التنبوؤي والتوجيهي. يق��دم عل��م البيان��ات والتعل��م الآيل م�س��اهمات كب��رية للعدي��د م��ن املوؤ�س�س��ات عن��د ا�س��تخدامهما ب�س��ورة منف�سلة ،اإل اأن تقنيات حتليل البيانات التقليدية ل تتنا�سب مع العمل ببيانات غري كاملة اأو غري دقيقة ،اأو يف حال كانت ال�سياقات التجارية اأو العلمية تتغري ب�سرعة كبرية مما يجعل البيانات تتقادم وتفقد قيمتها ب�سرعة كبرية .كما تدر الإ�سارة اإىل اأن تقنيات التعلم الآيل تتطلب قد ًرا كب ًريا من البيانات ن�سب ًيا. ي�س��تخدم اجلي��ل الق��ادم م��ن اأدوات عل��م البيان��ات ومن�س��ات ذكاء الأعم��ال تع ّل��م الآل��ة للقي��ام ببع���ص الإج��راءات مث��ل التع� ّرف عل��ى الأمناط يف البيانات لكت�س��اف الأمن��اط املخفية وتقدمي الت�سورات والروؤى املهم��ة لتخ��اذ الق��رارات ،و ُي��ز ّود تع ّل��م الآل��ة والتع ّل��م العمي��ق عل��م البيان��ات بتنب�وؤات اأك��رث دق��ة .اإن تواف��ر جمموع��ات البيان��ات ال�سخم��ة وانخفا���ص تكلف��ة معاجلته��ا �س��حاب ًيا ُمي ّك��ن تع ّل��م الآل��ة م��ن توف��ري اإمكان��ات مل تك��ن ممكن��ة يف املا�س��ي .وعن��د اجلم��ع ب��ني عل��م البيان��ات وال��ذكاء ال�سطناع��ي ،ميك��ن احل�س��ول عل��ى طريقة فعالة جدًا يف احل�سول على نتائج دقيقة ب�سكل ملحوظ ت�ساهم يف اتخاذ قرارات اأف�سل واأ�سرع.
الذكاء اال�سطناعي
(:)Artificial Intelligence اأح��د جم��الت عل��وم احلا�س��ب ويه��دف لبناء اأنظمة قادرة على اأداء املهام التي تتطل��ب ع��اد ًة ذكا ًء ب�س��ر ًيا مث��ل الق��درة على التعلم وال�ستدلل ،وحل امل�سكالت ومعاجلة اللغة الطبيعية والإدراك.
مثال اأن�س�اأت �س��ركة اأرامك� ال�س��ع�دية ق�س� ًما جديدًا مب�س��مى ق�س��م امل�سنع الرقمي لل�س��ركات ( ،)Corporate Digital Factory Departmentومت تدعيم هذا الق�سم بعلماء البيانات وخراء تع ّلم االآلة للبحث عن التحديات الت�سغيلية وتط�ير حل�ل ذكية للم�ساعدة يف حت�سن اأداء االأعمال .تعمل ال�سركة بجد يف الرتويج للحل�ل امل�ست�حاة من الذكاء اال�سطناعي وذلك با�ستخدام املليارات من نقاط البيانات التي قام بجمعها اخلراء واجلي�ل�جي�ن ومهند�س� البرتول على مدى عدة عق�د. ونظ� ًرا الأن اأرامك��� كان��ت عل��ى ال��دوام م��ن رواد ا�س��تخدام تقني��ات ال��ذكاء اال�سطناع��ي ،تق���م ال�س��ركة با�س��تخدام عل��م البيان��ات واأدوات التع ّل��م االآيل لتح�س��ن عمليات ا�ستخراج البرتول من املخزون امل�ج�د حتت �سطح البحر ا ً أي�سا ،وتعمل تقنيات الذكاء اال�سطناعي املتقدمة على حت�سن خطط تط�ير احلق�ل وم�سارات االآبار؛ مما ي�ؤدي اإىل خف�س التكلفة واحلفاظ على البيئة .ي�ستخدم علماء اجلي�ل�جيا بال�سركة اأدوات الذكاء اال�سطناعي يف درا�سة البيانات ب�س��كل اأ�س��رع واأك��ر كف��اءة م��ن اأي وق��ت م�س��ى .تعم��ل ه��ذه العملي��ة عل��ى حت�س��ن فه��م اخل�سائ���س البرتوفيزيائي��ة للت�ساري���س امل��راد ا�ستك�س��افها وحفره��ا وبالتايل تعزيز عملية اتخاذ القرارات. 13
دورة حياة علم البيانات Data Science Life Cycle
يق��وم علم��اء البيان��ات واملتخ�س�س��ني يف العم��ل عل��ى م�س��روعات عل��م البيان��ات بتوظي��ف خرباته��م م��ن خ��الل خط��وات حم��ددة لتنفي��ذ كل م�س��روع جدي��د بكف��اءة. ُيطل��ق عل��ى ه��ذه العملي��ة ا�س��م دورة حي��اة عل��م البيان��ات، وتت�سم��ن خم���ص مراح��ل .تتمي��ز ك ٌل م��ن املراح��ل املختلف��ة له��ذه ال��دورة بخ�سائ���ص معين��ة ،مم��ا يجع��ل م��ن املمك��ن اأن ت�س��مل م�س��روعات خا�س��ة مث��ل م�س��روعات ال��ذكاء ال�سطناع��ي وتع ّل��م الآل��ة ،اأو متثي��ل العملي��ات الداخلي��ة ملوؤ�س�س��ات معين��ة.
1
5
تعريف امل�سكلة و�سياغتها
متثيل البيانات
2
4
جمع البيانات
التحليل اال�ستك�سايف للبيانات
3 جتهيز البيانات وت�سحيحها
�سكل :1.4مراحل دورة حياة علم البيانات
.1تعريف امل�سكلة و�سياغتها
Problem Definition and Formulation
م��ن اأج��ل ت�سمي��م واإيج��اد ح��ل مل�س��كلة بوا�س��طة عل��م البيان��ات ،فاإن��ك حتت��اج ا ًأول اإىل فه��م ماهي��ة امل�س��كلة نف�س��هاُ .يع ُّد التحليل ال�س��امل للم�س��كلة وبيئتها واملتغريات التي توؤثر عليها اأم ًرا �سرور ًيا لتطوير احللول الالزمة لتلك امل�سكلة ،وميكن اأن يوؤدي فهمك مل�سكلة ما اإىل حت�سني اإمكانية حلها اأو اإعاقة حلها ب�سكل كبري ،وذلك لرتباطه املبا�سر بالنهج الذي �سيتم اتباعه حلل تلك امل�سكلة. ويكمن الهدف التايل يف حتديد الغاية املرجوة من هذا احلل ،حيث اأن جمموعة البيانات تت�سمن دائ ًما البيانات نف�سها ،ولكن طبيعة الإجابات التي تريد الو�سول اإليها قد تختلف ح�سب امل�سكلة املراد حلها.
تعريف امل�سكلة و�سياغتها: فه��م اأه��داف ومتطلب��ات العم��ل اأو امل�س��كلة العلمي��ة وحتوي��ل ه��ذه املعرف��ة اإىل م�ساألة ميكن حلها بتحليل البيانات.
جدول :1.4اأ�سهر اأنواع حتليالت البيانات حتليل االنحدار ()Regression Analysis حتليل الت�سنيف ()Classification Analysis التحليل العنقودي ()Clustering
حتليل انحراف البيانات
()Anomaly Detection Analysis
نظم التو�سية ()Recommendation engines
14
احل�س�ل على الكميات اأو ال�سفات امل�ج�دة يف جمم�عة البيانات. تنظيم البيانات يف فئات. تنظيم البيانات يف جمم�عات. البحث عن انحراف اأو �سذوذ يف البيانات. اإعطاء ت��سية م�ستنرية مل�ساألة حمددة.
.2جمع البيانات
Data Collection
بعد اأن يتم حتديد الأهداف ،يجب توفري جمموعة البيانات نف�سها ،ورغم اأنه قد يتم اإدخال البيان��ات يدو ًي��ا اأحيا ًن��ا ،فم��ن امله��م التنقيب وجم��ع البيانات ،حيث يتعني يف هذه املرحلة جمع بيان��ات كافي��ة ملوا�سل��ة معاجلته��ا .وميك��ن اأن تاأت��ي البيان��ات نف�س��ها م��ن جمموع��ة متنوع��ة من امل�سادرً ، فمثال تقوم اأجهزة ال�ست�س��عار البيئية وتطبيقات الهاتف املحمول ومن�سات الويب بتوليد البيانات ب�سورة م�س��تمرة ليتم تخزينها تلقائ ًيا يف قواعد البيانات.
جمع البيانات: عملي ��ة جم ��ع الق��راءات اأو احلقائ��ق وتن�س��يقها ،وت�س ��مل احل�س ��ول عليه ��ا وت�س ��ميتها وحت�س ��ينها.
�سيوعا جدول :1.5تن�سيقات تخزين البيانات االأكر ً امللفات املُن�سقة ()Formatted Files قواعد البيانات العالئقية (())Relational Databases
خادم مايكرو�س�فت SQLوقاعدة بيانات اأوراكل واأوراكل .MySQL
قواعد البيانات غري العالئقية ()Non-Relational NoSQL Databases
قواعد البيانات الر�سومية ()Graph Databases
قواعد بيانات ال�سال�سل الزمنية ()Time-series Databases
.3جتهيز البيانات وتنظيفها
JSONو XMLو CSVوجدول بيانات .XLS
MongoDBو Azure Cosmos DBو .AWS DynamoDB
Neo4jو AWS Neptuneو .Dgraph
InfluxDBو.AWS Timescale
Data Preparation and Cleaning
ُتع� ُّد عملي��ة "تنظي��ف" البيان��ات ومعاجلته��ا اأح��د اأه��م املراح��ل يف دورة حي��اة عل��م البيان��ات. يجب على عامل البيانات ت�سحيح وتهيز البيانات التي مت جمعها يف مرحلة التنقيب للتاأكد من منا�سبتها ملرحلة التحليل الالحقة ،وعند دمج البيانات من م�سادر متعددة تزيد احتمالية تكرار البيانات اأو تداخلها ،الأمر الذي يتطلب عملية ت�سحيح وت�سويب لتلك البيانات .وكذلك ه��و احل��ال اإذا ُوج��دت بيان��ات تالف��ة اأو من�س��قة ب�س��كل غ��ري �سحيح اأو مك��ررة اأو خاطئة اأو حتى غ��ري مكتمل��ة .تكم��ن اأهمي��ة ت�سحي��ح تل��ك البيان��ات يف اأن ال��روؤى اأو ال�س��تنتاجات امل�س��تمدة يف مرحل��ة التحلي��ل م��ن تل��ك البيان��ات �س��تكون خاطئة و�س��ي�س ُعب للغاية ا�س��تنتاج م��ا اإذا كانت امل�سكلة نا�سئة من اأخطاء يف خطوات التحليل اأو اأن البيانات نف�سها مل يتم ت�سحيحها ،ولهذا ال�س��بب ف�اإن عملي��ة تنظي��ف البيان��ات والتحق��ق م��ن �سحته��ا جي��دً ا قبل حتليلها ُتع� ُّد اأم ًرا مه ًما للغاية للعملية باأكملها.
تنظيف البيانات: عملي��ة متع��ددة املراح��ل ملراجع��ة البيان��ات وت�سحيحه��ا للتاأك��د م��ن اأنه��ا يف �سيغ��ة موح��دة ،ويت�سم��ن ذل��ك معاجل��ة القي��م املفق��ودة والبيان��ات امل�سو�س��ة ،وح��ل التناق�س��ات والتك��رارات.
15
.4التحليل اال�ستك�سايف للبيانات
Exploratory Data Analysis
بع��د اأن جمع��ت البيان��ات وقم��ت بت�سحيحه��ا ،ميكن��ك حتلي��ل جمموع��ة البيان��ات وا�س��تنباط الإجاب��ات املطلوب��ة لأ�س��ئلتك ،ويت��م اإج��راء حتلي��ل البيان��ات با�س��تخدام اأدوات حتلي��ل البيانات اأو الأك��واد واملكتب��ات الربجمي��ة املتخ�س�س��ة ،وقد يكون التحليل ب�س� ً �يطا وذلك بدرا�س��ة متغري واح��د اأو اأك��رث ،وق��د يت�س��ع لي�س��مل عملي��ات اأك��رث تعقي��دً ا تت�سمن عملي��ات اإح�سائية متقدمة. �يوعا يف الوق��ت احل��ايل لتحلي��ل جمموعة البيان��ات ،ويجب ُيع� ُّد تع ّل��م الآل��ة م��ن اأك��رث الط��رق �س� ً ا ِّتباع خطوات حمددة لتحليل البيانات با�ستخدام تع ّلم الآلة ،ففي البداية يجب حتديد منوذج تع ّلم الآلة باإيجاد قيم املدخالت واملخرجات يليها بناء خوارزمية التحليل نف�سها. تعت��رب ه��ذه العملي��ة معق��دة ،وله��ذا ف�اإن هن��اك متخ�س�س��ني للقي��ام به��ا مث��ل علم��اء البيان��ات ومهند�س��ي تع ّل��م الآل��ة .بع��د النته��اء م��ن اخلوارزمي��ة ،يت��م تري��ب النم��وذج واختب��اره ،وعن��د اكتم��ال هات��ني املرحلت��ني ميكن��ك ا�س��تخدام البيان��ات النات��ة من��ه للو�سول لالإجاب��ات املرجو احل�س��ول عليه��ا م��ن عملي��ات التحليل.
.5التمثيل الر�سومي للبيانات
Data Visualization
يتم تقدمي البيانات التي يتم حتليلها عادة ب�سورة جداول بيانات ،مما يتيح ملحللي البيانات ذوي اخل��ربة ا�س��تخدامها ،ويق��دم التمثي��ل املرئي��ي لتحلي��ل البيان��ات اإمكانية ا�س��تخال�ص روؤى وتو�سيات ذات جودة اأف�سل ،بينما توفر الر�سوم البيانية واملخططات وحتى اخلرائط ،وكذلك املن�س��قة طريق��ة فعال��ة لروؤي��ة وفه��م اأمن��اط البيانات واتاهاته��ا اأي ما توحي به تلك التقاري��ر ّ البيانات. ُيع� ُّد متثي��ل النتائ��ج اأم� ًرا �سرور ًي��ا لتخ��اذ ق��رارات ُم�س��تندة اإىل البيان��ات عن��د التعام��ل م��ع كمي��ات هائل��ة م��ن املعلوم��ات.
ال�سكل :1.5حتليل تف�سي فريو�ص كورونا ( )COVID-19با�ستخدام التحليالت املرئية .معهد �سا�ص.SAS. © 2022 SAS Inc -
16
التحليل اال�ستك�سايف للبيانات: ه��و نه��ج لتحلي��ل جمموع��ات البيان��ات لتلخي�ص خ�سائ�سها الرئي�سة ،ويتم عادة با�س��تخدام الأ�س��اليب املرئي��ة.
متثيل البيانات: ي�س ��لط التمثي ��ل الر�س ��ومي للمعلوم ��ات ال�س ��وء عل ��ى اأمن�اط واتاه ��ات البيان�ات، وي�س�اعد الق�ارئ عل�ى تطوير روؤى وتو�سيات بن��ا ًءا على تل��ك البيانات.
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1علم البيانات هو حقل متعدد التخ�س�سات ير ّكز على ا�ستخراج معلومات ذات فائدة من البيانات. ُ .2يطلق ا�سم املعرفة على البيانات عند حتليلها وتنظيمها وهيكلتها لت�سبح ذات معنى. .3يتم احل�سول على املعلومات من خالل عمليات حتليل البيانات. .4يطلق ا�سم املعرفة على عملية جمع البيانات بطريقة �سحيحة تعلها ذات فائدة. .5تُع ُّد الر�سوم البيانية واملخططات من و�سائل عر�ص املعلومات. .6تعترب معلومات حالة الطق�ص املقدمة من الأر�ساد اجلوية مبثابة معرفة. .7اإن عل��م البيان��ات ،وال��ذكاء ال�سطناع��ي ،وذكاء الأعم��ال ه��ي ث��الث جم��الت خمتلف��ة وم�س��تقلة عن بع�سها البع�ص. .8ي�س��اعد ا�س��تخدام التمثي��ل املرئ��ي لتحلي��ل البيان��ات عل��ى ا�س��تنباط روؤى اأف�س��ل مم��ا يعن��ي اكت�س��اب معرف��ة اأف�س��ل مبعنى تل��ك البيانات. .9تُع ُّد ُنظم التو�سية الذكية وحتليل النحدار من اأف�سل طرق تخزين البيانات. ُ .10تع� ُّد قواع��د بيان��ات ال�سال�س��ل الزمني��ة وقواع��د البيان��ات غ��ري العالئقي��ة ( )NoSQLج��ز ًءا م��ن و�س��ائل جمع البيانات.
17
2اأن�س��ئ قائم��ة م��ن البيان��ات ث��م ح���ل تل��ك البيان��ات اإىل معل�م��ات مفي��دة ،ث��م ِّ و�س��ح كي��ف يح� ّ�ل احلا�س��ب البيان��ات اإىل معل�مات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ِّ 3 و�سح الفروق الثالثة الرئي�سة بن علم البيانات والذكاء اال�سطناعي ،وادعم اإجاباتك ببع�س االأمثلة. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ِّ 4 و�س��ح وق��ارن ب��ن عل��م البيان��ات وذكاء االأعم��ال ،واإذا كان لدي��ك �س��ركة ا�س��تثمارية ،اأي احلقل��ن �س��يك�ن خي��ارك املف�سل لال�ستثمار؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
18
5م��ا م��دى فعالي��ة تق��ارب عل��م البيان��ات وال��ذكاء اال�سطناع��ي؟ ابح��ث يف االإنرتن��ت واذك��ر مثال��ن ناجح��ن عل��ى ذلك. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ِّ 6 و�س��ح املق�س���د بعل��م البيان��ات ،واذك��ر ثالث��ة تطبيق��ات حياتي��ة يف املج��ال ال�سح��ي ،وجم��ال االأعم��ال التجاري��ة، والرتفيه ،ث ّم ّبن ملاذا يُعدُّ علم البيانات �سرور ًيا ملثل هذه املجاالت؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ِّ و�س��ح وق��ارن ب��ن جمم�ع��ات البيان��ات املعاجل��ة وغ��ري املعاجل��ة الت��ي َت ِ�س� ْ�ف الدرج��ات الف�سلي��ة للطال��ب واأدا ِئ��ه 7 خ��الل الع��ام الدرا�س��ي. م��ا االنطباع��ات واالأف��كار الت��ي ميكن��ك احل�س���ل عليه��ا م��ن جمم�ع��ات البيان��ات ه��ذه؟ وه��ل ميكن��ك ت� ّق��ع االأداء االأكادمي��ي امل�س��تقبلي للطال��ب يف اجلامع��ة م��ن خ��الل ه��ذه البيان��ات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
19
8ابح��ث ع��ن مزي��د م��ن املعل�م��ات ح���ل "م�سن��ع اأرامك��� ال�س��ع�دية الرقم��ي" وح��دد ثالث��ة اأمثل��ة ال�س��تخدام ال��ذكاء اال�سطناعي يف ا�س��تخراج البيانات ،ومن ثم اعطينا راأيك يف مدى تاأثري هذه التقنيات على العمليات الت�س��غيلية لل�سركة؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
مف�سل��ة ع��ن من��اذج دورة حي��اة عل��م البيان��ات الت��ي ت�س��ف املراح��ل الرئي�س��ة املذك���رة يف 9ابح��ث يف االإنرتن��ت ب�س���رة ّ هذا الدر�س ،ومن ثم اخرت اإحداها وحدد املراحل االإ�سافية وا�سرحها باإيجاز. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
20
الدر�س الثاين
التعامل مع البيانات
ما املق�سود بالبيانات ال�سخمة؟
?What is Big Data
ي�س��ري م�سطل��ح البيان��ات ال�سخم��ة ( )Big Dataاإىل البيان��ات الكب��رية ج��دً ا اأو املعق��دة الت��ي ل ميك��ن لتتم معاجلتها با�س��تخدام معاجلته��ا بالط��رق التقليدي��ة ،ونظ� ًرا لأن ك��م ه��ذه البيان��ات ُيع� ُّد كب ًريا جدً ا ّ اأنظمة احلو�سبة التقليدية ،فاإن تخزين جمموعاتها ومعاجلتها يعترب حتد ًيا كب ًريا ،وكذلك قد تتطلب ال�س��رعة الهائلة لعملية جمع البيانات متطلبات تخزين عالية للغاية.
خ�سائ�س البيانات ال�سخمة
البيانات ال�سخمة (:)Big Data
جمموع��ة بيان��ات كب��رية تتطل��ب تقني��ات قابلة للتو�سع لتخزينها ومعاجلتها واإدارتها وحتليله��ا وذلك نظ� ًرا خل�سائ�ص حجمها، وتنوعها و�سرعتها وتباينها وبالطبع قيمتها.
Characteristics of Big Data
هن��اك خم�س��ة معاي��ري اأ�سا�س��ية ت�س��اعدنا يف ت�سني��ف اأي بيان��ات حت��ت م�سطل��ح "البيان��ات ال�سخم��ة"
وهي :التنوع ،والقيمة ،واحلجم ،واملوثوقية ،وال�سرعة .وتعترب البيانات "�سخمة" عندما تاأتي باأحجام كبرية ،ومبعدل �سريع جدً ا ،وبتنوع كبري ،وبدقة عالية ،وفائدة .ويجب اأن ت�ستويف البيانات جميع هذه املعايري لكي يتم اعتبارها "بيانات �سخمة".
التنوع
Variety
ي�س��ري التن��وع اإىل العدي��د م��ن اأن��واع البيان��ات املتوافرة،ويت��م هيكل��ة البيان��ات التقليدي��ة املختلف��ة وتكييفه��ا بدق��ة يف قواع��د البيان��ات العالئقي��ة ،ولك��ن م��ع ظه��ور البيانات ال�سخم��ة ،اأ�سبحت البيانات تتوافر يف اأن��واع جدي��دة غ��ري ّ منظم��ة .تتطل��ب اأن��واع البيان��ات غ��ري املنظم��ة و�س��به املنظم��ة (مثل الن�سو���ص وال�سوت والفيديو) معاجلة اإ�سافية م�سبقة ل�ستخال�ص املعاين ودع��م معلوم��ات البيان��ات الو�سفي��ة املتعلق��ة بتل��ك البيان��ات ،وب��دون ه��ذه البيان��ات الو�سفي��ة يك��ون م��ن امل�ستحيل معرفة ما يتم تخزينه وكيف ميكن معاجلته.
التنوع
ال�سرعة
القيمة
احلجم
املوثوقية
ال�سكل :1.6خ�سائ�ص البيانات ال�سخمة – املعايري اخلم�سة
21
القيمة
Value
اإن جم��ع الكث��ري م��ن البيان��ات ل يعن��ي اأن تل��ك البيان��ات ه��ي ذات قيم��ة ،فقيم��ة البيان��ات تتمث��ل يف اإمكاني��ة احل�س��ول عل��ى التو�سي��ات والو�س��ول اإىل بع���ص الأف��كار م��ن خالله��ا. ي�س��ري م�سطل��ح القيم��ة اإىل م��دى فائ��دة البيان��ات يف اتخ��اذ الق��رارات ،وبالطب��ع ف �اإن اإج��راء التحلي��الت املنا�س��بة ه��و و�س��يلة ا�س��تخراج قيم��ة البيان��ات ال�سخم��ة.
احلجم
Volume
نظ� ًرا لأن��ه يج��ب معاجل��ة كمي��ات كب��رية من البيان��ات غري املنظمة والت��ي تتمي��ز بقل��ة الكثاف��ة وت�س��مى ( ،)low density dataفاإن كم البيان��ات يع��د جان ًب��ا مه ًم��ا يف البيان��ات ال�سخم��ة .ميك��ن اأن تك��ون قيم��ة بع���ص ه��ذه البيان��ات غ��ري معروف��ة قبل القي��ام بتحليلها ،مثل بيان��ات ت�سف��ح امل�س��تخدمني لأح��د مواق��ع الوي��ب اأو اأح��د تطبيقات الهاتف الذكي ،اأو تلك البيانات التي يتم احل�سول عليها من اأجهزة اإنرتنت الأ�س��ياء املدعمة باأجهزة ال�ست�س��عار .قد ي�سل حجم هذه البيانات اإىل الع�سرات ،بل املئات من التريابايت من البيانات.
املوثوقية
Veracity
ترتب��ط �سح��ة البيان��ات مب��دى دق��ة جمموع��ة البيان��ات اأو موثوقيته��ا .ل ترتب��ط املوثوقي��ة بج��ودة البيان��ات نف�س��ها فح�س��ب، ب��ل ا ً أي�س��ا مب��دى م�سداقي��ة م�س��در البيان��ات ونوعه��ا وكيفي��ة معاجلتها.
ال�سرعة
Velocity
ي�س��ري م�سطل��ح ال�س��رعة اإىل مع��دل التق��اط البيان��ات وتخزينه��ا. تنت��ج البيان��ات م��ن معظ��م الأجه��زة الذكي��ة املت�سل��ة بالإنرتن��ت (اأجهزة اإنرتنت الأ�سياء) والأجهزة املحمولة يف الوقت احلقيقي اأو قري ًب��ا م��ن الوق��ت احلقيق��ي ،مم��ا يتطل��ب اجلم��ع الف��وري لتلك البيان��ات وكذلك نقله��ا وتخزينها.
تقنيات اإدارة البيانات ال�سخمة Technologies that Enable the Management of Big Data
ت�س��تخدم ال�س��ركات اأنظمة احلا�س��ب وقواعد البيانات لالحتفاظ بال�س��جالت املختلفة مثل املعامالت املتعلقة مبعاجلة الطلبات واملدفوعات وتتبع العمالء واإدارة التكلف��ة يف ال�س��ركات .حتت��اج ال�س��ركات ا ً أي�س��ا اإىل نظ��ام لإع��داد التقاري��ر لتوف��ري املعلوم��ات الت��ي ت�س��اعدها عل��ى العم��ل بكف��اءة ومل�س��اعدة امل��دراء التنفيذي��ني عل��ى اتخ��اذ القرارات املدرو�س��ة التي ت�سم��ن اأداء اأف�سل لالأعمال. يحت��اج مدي��رو املتج��ر الإلك��رتوين اإىل حت�س��ني ترب��ة ال�س��راء والتاأك��د م��ن اأن زوار املوق��ع الذي��ن يت�سفح��ون املنتجات �س��ي�سبحون زبائ��ن للمتجر وذلك من خالل �س��راء املنتجات ،وكذلك العمل على عودة الزبائن لل�س��راء مرات اأخرى يف امل�س��تقبل من خالل املوقع .ميكن لل�س��ركة حتليل جميع البيانات التي يتم جمعه��ا اأثن��اء ت�سف��ح ال��زوار للمتج��ر الإلك��رتوين عل��ى الوي��ب اأو م��ن خ��الل تطبي��ق الهاتف الذكي ،وتت�سم��ن تلك البيانات تفا�سيل دقيق��ة عن ت�سفح الزوار للموقع ،مبا فيها اأماكن و�سع املوؤ�سر على ال�سا�سة واأجزاء املوقع التي يق�سون وقتًا اأطول يف ت�سفحها ،ومدة املرور فوق املنتج قبل ال�سغط للح�سول على املزيد من املعلومات عنه اأو للقيام ب�سرائه بالفعل .ينتج عن هذه التفا�سيل الدقيقة التي يتم جمعها كم هائل من البيانات التي يجب حتليلها لتقدمي روؤية وا�سحة وقيمة للقائمني علي اأعمال ال�سركة .يتم ا�ستخدام نتائج حتليل تلك املعلومات لإحداث تغيريات يف خمطط موقع الويب اأو املتجر ،ولتعديل اأ�سعار املنتجات �سواء بالزيادة اأو باخل�سم ،ولتنظيم احلمالت الت�سويقية للمنتجات على و�سائل التوا�سل الجتماعي للتاأثري على �سلوكيات ال�سراء لدى الزبائن. يتطل��ب القي��ام به��ذا الأم��ر م��ن ال�س��ركات توف��ري تقني��ات واأدوات جدي��دة لإدارة وحتلي��ل البيان��ات ال�سخم��ة ل�س��تخراج قيم��ة الأعم��ال ،ويجب جم��ع البيانات املطلوب��ة م��ن امل�س��ادر الداخلي��ة كدوائ��ر املبيع��ات والت�سني��ع واملحا�س��بة ،وكذل��ك من امل�سادر اخلارجي��ة كالبيانات الإح�سائية عن النمو ال�س��كاين وطبيعة الزبائن واأعمارهم ،وكذلك البيانات املتعلقة بال�سركات املناف�سة ً مثال ،وذلك ل�ستخراج معلومات موجزة وموثوقة حول الو�سع احلايل وامل�ستقبلي لل�سركة والتاأث��ريات املحتمل��ة ملتغ��ريات ال�س��وق .حتت��وي البني��ة التحتي��ة احلديث��ة ل��ذكاء الأعم��ال عل��ى جمموعة م��ن الأدوات والتقني��ات لتخزين البيان��ات ومعاجلتها للح�سول على معلومات مفيدة من البيانات ال�سخمة ،وت�س��مل هذه التقنيات م�س��تودعات البيانات وبحريات البيانات وعمليات احلو�س��بة يف الذاكرة.
22
م�ستودعات البيانات
Data Warehouse
ق��د تعت��رب م�س��تودعات البيان��ات الأداة الأق��دم لتحلي��ل بيان��ات ال�س��ركات .ي�س��ري م�س��تودع البيان��ات اإىل قاع��دة البيان��ات الت��ي تخ��زن البيان��ات احلالي��ة والتاريخي��ة الت��ي نتج��ت ع��ن العدي��د من اأنظمة املعامالت الت�سغيلية الأ�سا�سية مثل اأنظمة املبيعات ،ودعم العمالء ،والت�سنيع ،والتي تعل البيانات متاحة ل�سانعي القرار يف ال�س��ركة ،ويت��م دم��ج ه��ذه البيان��ات م��ع البيان��ات م��ن امل�س��ادر اخلارجي��ة لتحوي��ل البيان��ات غري املكتمل��ة اإىل بيانات ّ منظمة قبل تخزينها يف م�ستودع البيانات .يوفر نظام م�ستودع البيانات ا ً أي�سا جمموع��ة م��ن الأدوات للتحلي��ل وال�س��تعالم وكذل��ك اأدوات اإعداد التقارير الر�س��ومية.
احلو�سبة يف الذاكرة
In-Memory Computing
ه��ي طريق��ة لت�س��هيل عملي��ة حتلي��ل البيان��ات ال�سخم��ة لعتماده��ا ب�س��ورة اأ�سا�س��ية عل��ى ذاك��رة احلا�س��ب الرئي�س��ة ( )RAMلتخزي��ن البيان��ات .ي�س��ل امل�س��تخدمون اإىل البيانات املخزنة يف الذاكرة الأ�سا�س��ية للنظام وبالتايل يتم تاوز معوقات ا�سرتداد وقراءة البيانات املوجودة يف قاعدة البيانات التقليدي��ة امل�س��تندة اإىل التخزي��ن عل��ى الأقرا���ص مم��ا يعن��ي تقلي��ل وق��ت ال�ستعالم ب�سكل كبري .تتميز اخلوادم ال�سحابية ب�سكل خا�ص بوجود �سعة كب��رية م��ن ذاك��رة الو�س��ول الع�س��وائي ،مما ي�س��هل ا�س��تخدامها يف عمليات احلو�س��بة يف الذاكرة.
بحرية البيانات
Data Lake
بح��رية البيان��ات ه��ي م�س��تودع بيان��ات ع��اد ًة م��ا يك��ون �س��حاب ًيا ُي�س��تخدم لتخزين كميات هائلة من البيانات الأولية وغري املعاجلة .يف هذه الطريقة كل م��ن البيان��ات املنظم��ة (مث��ل يت��م ا�س��تخدام عن��وان URLثاب��ت لدع��م ٍ قواع��د البيان��ات) والبيان��ات غ��ري املنظمة (مثل ر�س��ائل الربيد الإلكرتوين وامل�ستندات).
يعت��رب التميي��ز ب��ني ه��ذه التقني��ات الثالث��ة مه ًم��ا نظ� ًرا لالأغرا���ص املختلف��ة ل�س��تخدامها ولكيفي��ة عمله��ا يف معاجل��ة البيان��ات ب�س��كل �سحي��ح .ل تعم��ل ه��ذه التقني��ات م ًع��ا ،ولك��ن يت��م اختي��ار اإحداه��ا اعتم��ادًا عل��ى ن��وع ال�س��ركة ،فق��د تك��ون بح��رية البيان��ات ه��ي اخلي��ار اجلي��د لإحدى ال�س��ركات ،بينما يعد م�س��تودع البيان��ات اخلي��ار الأف�س��ل ل�س��ركة اأخرى.
التنقيب يف البيانات ال�سخمة
Mining Big Data
كم��ا عرف��ت �س��اب ًقا ،يت��م جم��ع البيان��ات ال�سخم��ة با�س��تمرار بوا�س��طة اأجه��زة ال�ست�س��عار والتطبيق��ات العامة والتطبيقات ال�سخ�سية .اإن عملية جمع البيانات لي�ست �سوى اخلطوة الأوىل يف العملية امل�سار اإليها با�س��م اكت�ساف املعرفة. ي�س��ري اكت�س��اف املعرف��ة اإىل العملي��ة ال�س��املة للو�س��ول اإىل املعرف��ة املفي��دة م��ن البيان��ات ،وي�س��ري التنقيب يف البيانات اإىل خطوة معينة يف هذه العملية ،فالتنقيب عن البيانات هو تطبيق خلوارزميات حم��ددة ل�س��تخراج الأمن��اط م��ن البيان��ات ،وحتدي��د العالق��ات املختلف��ة داخ��ل ه��ذه البيان��ات .تعت��رب اخلط��وات الأخ��رى يف عملي��ة اكت�س��اف املعرف��ة مثل تنظيف البيانات ،وتكام��ل البيانات ،وحتويل �سيغة البيان��ات ،والتف�س��ري ال�سحي��ح لنتائ��ج التنقي��ب �سروري��ة ل�سمان ا�س��تقاق املعرفة املفي��دة من البيانات (انظ��ر اجل��دول .)1.6
التنقيب يف البيانات (:)Data Mining
عملي ��ة اكت�س ��اف الأمن ��اط ف�ي كمي�ة كبي�رة م�ن البيان�ات وا�س�تخراج املعلوم�ات املفي�دة يف توقع ال�سلوك امل�ستقبلي.
بع�س املهام الرئي�سة التي يتم اإجنازها عن طريق التنقيب يف البيانات: حتليل البيانات الكت�ساف االأمناط واالجتاهات. �سياغة التنب�ؤات ملدخالت جمم�عات البيانات املختلفة. ت�سنيف اأو جتميع اأو ت�قع القيم املختلفة ملجم�عة البيانات. ت�سهيل عملية اتخاذ القرارات املدرو�سة. 23
اجلدول :1.6خطوات اكت�ساف املعرفة ت�سحيح البيانات:
تنظيف البيانات التالفة وغري املطابقة ،واإزالة اأن�اع البيانات اخلاطئة وما اإىل ذلك.
تكامل البيانات:
يحدث التنقيب يف البيانات من م�سادر متعددة .يجب دمج م�سادر البيانات هذه يف جمم�عة بيانات واحدة.
اختيار البيانات:
حتديد جزء جمم�عة البيانات الذي يجب ا�ستخدامه لعملية ا�ستخراج البيانات .من املهم حتديد جمم�عة البيانات االأكر م�اءمة الأهدافك الأن ا�ستخراج البيانات مهمة ت�ستغرق وق ًتا ً ط�يال.
حتويل �سيغة البيانات: التنقيب يف البيانات:
يُع ُّد اإعداد جمم�عات البيانات االأولية وتن�سيقها اأم ًرا �سرور ًيا الأن عمليات التنقيب عن البيانات حتتاج اإىل اأن يك�ن ملدخالتها تن�سيق حمدد لتحليلها. هي العملية الفعلية لتحليل البيانات وا�ستخراج النتائج املرج�ة من التحليل من خالل االأمناط.
تقييم النمط:
تقييم االأمناط التي مت اإن�ساوؤها خالل خط�ات التنقيب عن البيانات ،وحتديد اأيها مفيد لكل هدف حمدد.
متثيل املعرفة:
متثيل النتائج التي مت احل�س�ل عليها من خالل التقارير ،والر�س�م البيانية واملخططات ال�ا�سحة واملخت�سرة.
البيانات ال�سخمة والتخزين ال�سحابي
Big Data and Cloud Storage
هن��اك خي��اران معتم��دان لتخزي��ن البيان��ات ال�سخم��ة :التخزي��ن ال�س��حابي والتخزي��ن الداخل��ي ،ولق��د كان تطوي��ر تطبيق��ات البيان��ات ال�سخم��ة يف املا�س��ي أ�سا�س��ا عل��ى حف��ظ البيان��ات يف و�س��ائط التخزي��ن داخل ًي��ا (عل��ى اخل��وادم داخل ال�س��ركات واملوؤ�س�س��ات) ،مما تطلب توفر م�س��تودعات بيانات حملية يعتم��د ا ً عالية التكلفة ،وكذلك تثبيت برامج معقدة لإدارة تلك امل�س��تودعات� .س��اهمت التطورات احلديثة يف علوم احلو�س��بة والبيانات يف ا�س��تبدال تلك الطريقة بالتخزي��ن ال�س��حابي ،وال��ذي يع��د مبثاب��ة احل��ل الأمث��ل لتخزين البيانات ال�سخم��ة ،وذلك ملا يلي: اأ) توافر النطاق العري�ص عايل ال�س��رعة على نطاق وا�س��ع ي�س��هل حركة البيانات من مكان اإىل اآخر .ومع وجود بيانات منتجة حمليا مل تعد هناك حاجة لتخزين البيانات داخل ًيا، بل اأ�سبح بالإمكان نقلها اإىل التخزين ال�سحابي لتحليلها. ب) اأ�سبح��ت غالبي��ة التطبيق��ات تعتم��د عل��ى التخزي��ن ال�س��حابي ،مم��ا يعن��ي اأن عملي��ة اإنت��اج املزيد من البيانات وتخزينها �سحاب ًيا تزداد با�ستمرار ،ولقد �ساهم ذلك يف قيام اأعداد متزاي��دة م��ن رواد الأعم��ال بعم��ل حتليالت جديدة للبيانات ال�سخمة مل�س��اعدة ال�س��ركات عل��ى حتلي��ل البيان��ات ال�س��حابية يف كث��ري م��ن املجالت مثل معام��الت التجارة الإلكرتونية وبيانات اأداء تطبيقات الويب. هن��اك جوان��ب متع��ددة للتخزي��ن ال�س��حابي تعل��ه خي��ا ًرا اأف�س��ل لل�س��ركات ،فمث� ً�ال ميك��ن اأن ي�سمل التخزين ال�سحابي اأنظمة تخزين البيانات ال�سخمة وكذلك اأنظمة الن�سخ الحتياطي. وتوج��د الكث��ري م��ن اخلي��ارات املتاح��ة م��ن ِقب��ل م��زودي اخلدمات مث��ل اأمازون ومايكرو�س��وفت وقوقل للتخزين ال�سحابي مع توفريها حماية البيانات واخل�سو�سية ،وبالطبع قابلية التو�سع والتكلف��ة املعقولة لهذه اخلدمات. 24
�سكل :1.7مركز بيانات يوفر خدمة التخزين ال�سحابي
با�س��تخدام الن�س��خ الحتياطي ال�س��حابي للبيانات ال�سخمة ،ميكن للموؤ�س�س��ات ال�س��تفادة من اخلدم��ات م��ن مراك��ز البيان��ات الت��ي متت��د ع��رب مواقع جغرافي��ة متعددة ،مم��ا ي�سمن التوافر الدائ��م وا�س��تعادة البيان��ات ب�س��هولة .وبا�س��تخدام التخزي��ن ال�س��حابي ميك��ن ن�س��خ البيان��ات احتياط ًي��ا ع��رب ع��دة مراك��ز بيان��ات يف مناط��ق خمتلف��ة م��ن الع��امل ،وبذل��ك ل يت��م الحتف��اظ بالن�س��خ الحتياطي��ة يف م��كان واحد. توف��ر تقني��ات التخزي��ن ال�س��حابي خ�سائ���ص اأخ��رى للحماية للن�س��خ الحتياطي��ة حيث ي�سمن مقدمو تلك التقنيات حماية البيانات املن�سوخة احتياط ًيا اإىل التخزين ال�سحابي عرب تقنيات الت�سفري املتقدمة قبل القيام بنقل البيانات وخالل نقلها وكذلك بعد نقلها. وكما ُذكر �س��اب ًقا ،فاإن معاجلة البيانات ال�سخمة تتطلب �س��عة تخزين وقوة معاجلة ،اأما من حيث ال�س��عة التخزينية ،فاإن التقنيات ال�س��حابية تفي بهذا الأمر ،وميكن لل�س��ركات احل�سول عل��ى خدم��ات التخزي��ن القابل��ة للتو�س��ع بي�س��ر .ميك��ن له��ذه التقني��ات ا ً أي�س��ا تلبي��ة متطلب��ات احلو�سبة لتحليل البيانات ال�سخمة ،وقد اأ�سبح خرباء حتليالت البيانات يو�سون با�ستخدام اخلدم��ات املدعوم��ة �س��حاب ًيا للقي��ام بعملي��ات التحلي��ل لإدراكه��م بالإمكاني��ات الالنهائية التي توفرها التقنيات.
مزايا وعيوب تخزين البيانات ال�سخمة �سحاب ًيا
Pros and Cons of Big Data Cloud Storage
ميك��ن م��ن خ��الل اجلم��ع ب��ني حتلي��الت البيان��ات ال�سخم��ة واحلو�س��بة ال�س��حابية اإيجاد فر�ص مل تكن ممكنة من قبل لفه��م البيانات واحل�سول على املعرفة ودع��م عملي��ات اتخ��اذ الق��رارات .يج��ب علي��ك النظ��ر اإىل املزاي��ا وكذل��ك اإدراك التحدي��ات الت��ي تتعلق با�س��تخدام احلو�س��بة ال�س��حابية يف العمليات املتعلقة بالبيانات ال�سخمة. جدول :1.7مزايا وعيوب تخزين البيانات ال�سخمة �سحاب ًيا املزايا
العيوب
تتطلب الكميات الكبرية من البيانات املنظمة وغري املنظمة ت�فر �سبكات ذات نطاق ار�سال وا�سع وذلك ل�سرعة االإر�سال والتخزين. ي�فر التخزين ال�سحابي بنية حتتية متاحة ب�سه�لة مع القدرة على الت��سع للتعامل مع اأي مقدار من حركة مرور البيانات ومتطلبات التخزين.
تقدم اإمكانيات حتكم مبا�سر اأقل يف اأمن البيانات ،وقد تتعر�س لعمليات ت�ؤدي اإىل انتهاك البيانات ،وبالتايل اإىل ع�اقب خطرية فيما يتعلق بل�ائح خ�س��سية البيانات.
ي�ؤدي تخزين البيانات ال�سخمة �سحاب ًيا اإىل التخل�س من احلاجة اإىل االحتفاظ باأجهزة وبرامج وم�ظفن متخ�س�سن عند احلاجة، ويُعدُّ من�ذج احل��سبة ال�سحابية املبني على الدفع ح�سب احلاجة اإىل اخلدمات اأكر فعالية من حيث التكلفة ،مما ي�ساهم يف خف�س التكلفة وزيادة الكفاءة واحلد من هدر امل�ارد.
ميكن ملزود اخلدمة ال�سحابية رفع تكلفة اخلدمات التي يقدمها يف اأي وقت ،مما يعني ارتفاع التكلفة الأعمال ال�سركات امل�ستخدمة لهذه اخلدمات ،والتي ال ميكنها االنتقال ب�سه�لة اإىل مقدم خدمات اآخر يقدم اأ�سعا ًرا تناف�سية.
تر ِّكز ال�سركة على عمليات حتليل البيانات ً بدال من اإدارة البنية التحتية ،مما ينعك�س ب�سكل اإيجابي على االأداء وامليزة التناف�سية.
يعني تخزين البيانات ال�سخمة �سحاب ًيا اأن ت�فر البيانات يعتمد على االت�سال بال�سبكة .ت�ؤثر امل�ساكل املتعلقة بال�سبكات كتدين ج�دة االت�سال اأو تا ُّأخر اال�ستجابة ( ،)latencyوالتي قد تظهر يف البيئة ال�سحابية على �سرعة جمع البيانات ومعاجلتها وتخزينها. 25
�سيا�سة ال�سركات وحوكمة البيانات
Data Governance and Policies
حتدد ال�سوابط والهياكل التنظيمية لل�سركات واملوؤ�س�سات امل�سوؤوليات وطرق اتخاذ القرارات املتعلقة باإدارة البيانات ،والتي تت�سمن تطوير ال�سيا�سات والإجراءات الداخلية التي تتحكم باإدارة البيانات. ت�س��اعد اإدارة البيان��ات املوؤ�س�س��ات اخلا�س��ة اأو املوؤ�س�س��ات احلكومي��ة وغ��ري الربحي��ة يف التعام��ل م��ع عمليات اإدارة البيانات بجودة عالية خالل جميع مراحل دورة حياة البيانات ،وتوؤدي هذه ال�سيا�سات والإجراءات الفعالة اإىل حت�سني الأعمال والنتائج ،حيث تقوم ال�سركات واملوؤ�س�سات بجمع كميات هائلة م��ن البيان��ات الداخلي��ة واخلارجي��ة ،وتعت��رب اإدارة البيان��ات �سروري��ة ل�س��تخدام تل��ك البيانات بفعالية واإدارة املخاط��ر وخف���ص التكاليف املختلفة.
اأهمية حوكمة البيانات
اآمنة.
م�ث�قة. مُ�ثقة. مُدارة. مُدققة.
The Importance of Data Governance
م��ن غ��ري املمك��ن ت�سحي��ح التناق�س��ات املوج��ودة يف بيان��ات الأنظم��ة املختلف��ة داخ��ل املوؤ�س�س��ة ب��دون اإدارة منا�س��بة للبيان��ات .فعل��ى �س��بيل املث��ال ،ق��د يت��م تخزي��ن اأ�س��ماء العم��الء يف اأنظم��ة املبيع��ات واأنظم��ة خدم��ة العمالء بط��رق خمتلفة. قد ُي�س ّعب هذا الأمر من تكامل البيانات ويوؤثر على دقة ذكاء الأعمال وعلى اإعداد التقارير. كذل��ك فق��د ل يت��م اكت�س��اف اأخط��اء البيان��ات املوج��ودة وبالت��ايل ل يت��م ت�سحيحه��ا يف الوق��ت املنا�سب ،مما يعر�ص �سالمة البيانات للخطر. اأ�سب��ح واج ًب��ا عل��ى املوؤ�س�س��ات اأن متتث��ل للت�س��ريعات اجلدي��دة اخلا�س��ة بخ�سو�سي��ة البيان��ات وحمايته��ا مث��ل الالئح��ة العام��ة حلماي��ة البيان��ات يف الحت��اد الأوروب��ي ()GDPR وقان��ون خ�سو�سي��ة امل�س��تهلك يف كاليفورني��ا ( ،)CCPAوذل��ك لأن حوكم��ة البيان��ات ب�س��ورة �س��يئة ت��ر املوؤ�س�س��ات اإىل �سعوب��ات و تعله��ا حت��ت طائل��ة مواجه��ة العقوب��ات. ُي ّ نظ��م قان��ون حماي��ة البيان��ات ال�س��خ�سية اجلدي��د يف اململك��ة العربي��ة ال�س��عودية ()PDPL مو�سوع معاجلة البيانات ال�سخ�سية ،ويعد مبثابة الت�سريع الأول اخلا�ص بخ�سو�سية البيانات احلكومية يف اململكة العربية ال�سعودية .ي�سمل هذا الت�سريع جميع ال�سناعات واأنواع املوؤ�س�سات، وي�س��رف مكت��ب اإدارة البيان��ات الوطني��ة ( )NDMOعل��ى اللوائح اجلدي��دة ويفر�سها ،وينطبق هذا القانون ا ً أي�سا على املوؤ�س�س��ات الأجنبية العاملة يف اململكة العربية ال�س��عودية التي تتعامل مع البيانات ال�سخ�سية للمواطنني واملقيمني يف اململكة ،وب�سكل خا�ص تلك البيانات ال�سحية والئتمانية واملالية.
مكونات اإطار عمل حوكمة البيانات Data Governance Framework Components
ت�س��كل ال�سيا�س��ات وال�سواب��ط التوجيهي��ة والعملي��ات والهي��اكل التنظيمي��ة والتقني��ات املُنف��ذة كج��زء م��ن برنام��ج احلوكم��ة اإط��ار عم��ل حلوكم��ة البيان��ات ،ويح��دد اإط��ار العم��ل ا ً أي�س��ا مهم��ة الربنامج واأهدافه وامل�س�وؤوليات املختلفة وكيفية قيا���ص النجاح يف املهام التي �س��يتم ت�سمينها يف الربنام��ج. يج��ب اإن�س��اء اإط��ار احلوكم��ة يف اأي موؤ�س�س��ة ون�س��ره داخل ًي��ا و�س��رح اآلي��ة عمله بحي��ث يكون لدى كل م�سارك فهم وا�سح منذ البداية. 26
ت�سمن حوكمة البيانات اأن البيانات:
تتطل��ب بع���س اأن��واع البيان��ات كالبيان��ات املالي��ة وال�سحي��ة معاجل��ة ب�سكل اأكر دقة من البيانات االأخرى، فعاد ًة ما يتم تنظيم البيانات ال�سحية ب�س��كل جي��د ب��دءا م��ن مرحل��ة جم��ع تل��ك البيان��ات حت��ى اإع��داد التقاري��ر ون�س��ر املعلوم��ات .يتفه��م جمي��ع م��ن يهمه��م االأم��ر متا ًم��ا املخاط��ر املتعلق��ة باخل�سو�سي��ة وتل��ك القي��ود الت��ي تفر�سه��ا الت�س��ريعات ،وبالت��ايل ف �اإن حتدي��د اإط��ار عم��ل حوكم��ة البيان��ات يف املوؤ�س�س��ات ال�سحي��ة كامل�ست�س��فيات ُيع��د اأم� ً�را مه ًم��ا للغاي��ة.
معايري حوكمة البيانات
Data Governance Standards
قام��ت منظم��ة املعاي��ري الدولي��ة ISOبتطوي��ر معي��ار ISO/IEC 38505لتطبي��ق مب��ادئ حوكم��ة تقني��ة املعلوم��ات عل��ى متطلب��ات اإدارة البيان��ات. جدول :1.8املبادئ ال�ستة حلوكمة البيانات امل�سئولية
ُت ّ عن لالأفراد.
اال�سرتاتيجية
تت�افق مع مهمة وروؤية امل�ؤ�س�سة.
احليازة
تت�افق مع املتطلبات التنظيمية.
التوافق
�سمان االمتثال للت�سريعات وال�سيا�سات الداخلية واأخالقيات العمل.
االأداء
تلبية متطلبات امل�ؤ�س�سة.
ال�سلوك االإن�ساين
ت�سجيع النا�س على امل�ساركة.
معايري اإدارة البيانات ال�سعودية Saudi Data Management Standards
عل��ى غ��رار متطلب��ات اإدارة البيان��ات الدولي��ة ،ISO/IEC 38505ط� ّور مكت��ب اإدارة البيان��ات الوطني��ة (� )NDMOسواب��ط اإدارة البيان��ات الوطني��ة وحماية البيانات ال�س��خ�سية يف اململكة. يعترب مكتب اإدارة البيانات الوطنية م�سو ًؤول عن تنفيذ ال�سوابط وال�سيا�سات واآليات احلوكمة وال�سواب��ط اخلا�س��ة بالبيان��ات وال��ذكاء ال�سطناع��ي ومتابع��ة المتث��ال م��ن قب��ل املنظم��ات وال�س��ركات .تنطب��ق املعاي��ري عل��ى جمي��ع البيان��ات بغ���ص النظ��ر عن النم��وذج اأو النوع مبا فيها ال�سجالت الورقية والبيانات الرقمية والت�سجيالت ال�سوتية و ال�سور ومقاطع الفيديو ،وكذلك امل�س��تندات املكتوبة بخط اليد اأو اأي �س��كل من اأ�س��كال البيانات امل�س��جلة.
https://sdaia.gov.sa/ndmo
مثال
�س��كل :1.8من��اذج ل�سفح��ات م��ن مكت��ب اإدارة البيان��ات الوطنية � -سوابط وموا�سفات اإدارة البيانات الوطنية وحوكمتها وحماية البيانات ال�سخ�سية © الهيئة ال�سعودية للبيانات والذكاء ال�سطناعي
اأن�س�اأت �س��ركة ات�س��الت �س��عودية قط��اع حتلي��ل البيان��ات املوؤ�س�س��ية ( )CADعام 2016للم�س��اعدة يف حتقي��ق هدفه��ا املتمث��ل يف تق��دمي اأف�س��ل ممار�س��ات حوكمة واإدارة البيانات .تعترب البيانات والأ�سخا�ص والعمليات والتقنيات من اأهم ركائز ال�س��ركة يف احلوكم��ة ،حي��ث تت�سم��ن املب��ادرة حتقي��ق جمي��ع الركائ��ز لأجل حتول رقمي ناجح. ت�سعى ال�سركة الآن اإىل اعتماد حلول حوكمة البيانات املبتكرة التي تعزز الذكاء ال�سطناعي وتو�سع مفهوم حوكمة البيانات اإىل "حوكمة التحليالت". يهدف هذا ال�سعي اإىل حتقيق تغيري اإيجابي يف الأعمال وذلك من خالل حتديد املتطلبات وخطوات �سري الأعمال ب�سكل وا�سح.
27
حوكمة البيانات واإدارتها Data Governance versus Data Management
م��ن الأهمي��ة مب��كان اإدراك اأن حوكم��ة البيان��ات ه��ي اأح��د مكونات اإدارة البيانات ال�س��املة .اإن و�سع القواعد الإر�سادية حلوكمة البيانات دون التنفيذ الفعلي لها يعترب م�سيعة للوقت واجلهد دون معنى اأو قيمة حقيقية ،فحوكمة البيانات حتدد جميع ال�سوابط وال�سيا�سات والعمليات، والت��ي تُنف��ذ بوا�س��طة اإدارة البيان��ات ،والت��ي مهمته��ا ه��ي جم��ع البيانات وا�س��تخدامها يف �سنع الق��رار م��ن خ��الل اتب��اع اأ�سا�س��يات احلوكم��ة والت��ي تتمث��ل بال�سواب��ط وال�سيا�س��ات والعملي��ات املتعلقة بالبيانات .ت�سبه حوكمة البيانات عملية تطوير الت�سميم لبناء منزل جديد ،اأما اإدارة البيانات فهي عملية البناء نف�سها ،فاإذا تخيلت هذا الأمر ،فيمكنك بناء منزل دون ت�سميم، ولكن هذا البناء �سيكون اأقل كفاءة وجودة ،مع وجود احتمال الف�سل يف بنائه بالدرجة الأوىل.
حتديات حوكمة البيانات
اإدارة البيانات: اإدارة البيان��ات ه��ي اإن�س��اء وتنفي��ذ البن��ى وال�سيا�س��ات والإج��راءات الت��ي تدي��ر احتياج��ات دورة حي��اة البيان��ات الكامل��ة للموؤ�س�س��ة.
Data Governance Challenges
ُتع��د التحدي��ات املرتبط��ة بالبيان��ات ال�س��حابية والبيان��ات ال�سخم��ة م��ن الأم��ور ال�س��ائعة الت��ي تواجهها املوؤ�س�سات بخ�سو�ص حوكمة البيانات ،فاخلدمات ال�سحابية واأنظمة البيانات ال�سخمة ت�س��تدعي متطلب��ات حوكم��ة جدي��دة .لق��د كان تركي��ز برامج حوكمة البيان��ات حتى وقت قريب على البيانات املنظمة املخزنة يف مركز البيانات ،اأما الآن فاأ�سبح من ال�سروري التعامل مع الكثري من البيانات املنظمة وغري املنظمة و�سبه املنظمة التي قد تظهر م ًعا يف بيئات البيانات ال�سخم��ة ،بالإ�ساف��ة اإىل تهدي��دات اخل�سو�سي��ة املرتبط��ة باأنظم��ة البيان��ات ال�س��حابية.
من امل�سوؤول عن حوكمة البيانات؟
?Who is Responsible
ت�س��م عملي��ة حوكم��ة البيان��ات جمموع��ة متنوع��ة م��ن الأ�س��خا�ص يف معظ��م املوؤ�س�س��ات ،ويت��م ت�سمني امل�ستخدمني النهائيني املطلعني على البيانات ذات العالقة يف اأنظمة املوؤ�س�سة ،وكذلك مدراء الأعمال ،واملتخ�س�سني يف اإدارة البيانات ،وموظفي تقنية املعلومات ،ويتحمل امل�سئولية الرئي�س��ة عن احلوكمة عادة رئي���ص ق�س��م املعلومات ( )CIOاأو كبري م�س�وؤويل البيانات ()CDO ومدي��ر اإدارة البيان��ات (.)DGM ُيع� ُّد رئي���ص ق�س��م املعلوم��ات اأح��د كب��ار امل�س�وؤولني التنفيذي��ني ع��ن برنام��ج حوكم��ة البيان��ات، وت�س��مل م�س�وؤولياته احل�سول على املوافقة ،والتمويل ،والتوظيف يف الربنامج ،وكذلك تقدمي املب��ادرات ،وتقيي��م تط��ور الربنامج ،والرتويج له بفاعلية. فاعتم��ادًا عل��ى حج��م املوؤ�س�س��ة ،يت��م تعيني مدير عام لإدارة البيانات ولقيادة وتن�س��يق مبادرة احلوكم��ة ،حي��ث يت��وىل عق��د الجتماع��ات ،وتنفي��ذ ال��دورات التدريبية ،وتتبع موؤ�س��رات الأداء الرئي�سة ،واإدارة الت�سالت الداخلية للمبادرة .ويعمل مدير اإدارة البيانات مع مالكي البيانات وامل�س�وؤولني الذي��ن ي�سمن��ون تطبي��ق �سواب��ط وقواع��د حوكم��ة البيان��ات واتب��اع امل�س��تخدمني النهائيني لها.
28
مالك البيانات: �س��خ�ص اأو اأ�س��خا�ص م�س�وؤولون ع��ن بيان��ات حمددة.
م�سرف بيانات: تت�سم��ن مه��ام م�س��رف البيان��ات اإدارة البيان�ات من خالل تنفي�ذ �سيا�س�ات حوكم�ة البيان�ات واملحافظة عليه�ا داخ�ل املوؤ�س�س�ة.
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1ت�س��ري البيان��ات ال�سخم��ة اإىل البيان��ات الكب��رية ج��دً ا اأو املعق��دة الت��ي ل ميك��ن معاجلتها با�س��تخدام الطرق التقليدية. .2م��ن التقني��ات اخلم���ص الت��ي متك��ن م��ن اإدارة البيان��ات ال�سخم��ة ال�س��رعة وامل�سداقي��ة وم�س��تودع البيانات. .3يعترب اكت�ساف املعرفة عملية ب�سيطة ل تتطلب اأي خطوات حمددة. .4التخزي��ن ال�س��حابي ه��و طريق��ة التخزي��ن الوحي��دة امل�س��تخدمة لك��م البيان��ات الكب��ري مث��ل البيان��ات ال�سخمة. ُ .5تع � ُّد قابلي��ة التو�س��ع والتكلف��ة املنخف�س��ة لتحلي��ل البيان��ات م��ن املزاي��ا العدي��دة لتخزي��ن البيان��ات ال�سخم��ة �س��حاب ًيا. .6م�س��تودع البيان��ات ه��و م�س��تودع يتواف��ر �س��حاب ًيا ع��اد ًة لتخزي��ن كمي��ات هائل��ة م��ن البيان��ات الأولي��ة وغ��ري املعاجلة. .7احلو�س��بة يف الذاك��رة ه��ي طريق��ة لت�س��هيل حتلي��ل البيان��ات ال�سخم��ة لعتماده��ا ب�س��ورة اأ�سا�س��ية عل��ى ذاكرة احلا�س��ب الرئي�س��ة لتخزي��ن البيانات. .8ت�س��ري بح��رية البيان��ات اإىل قاع��دة البيان��ات الت��ي تخ��زن البيان��ات احلالي��ة والتاريخي��ة النات��ة ع��ن اأنظمة املعامالت الأ�سا�س��ية يف املوؤ�س�س��ة. .9اختي��ار البيان��ات ه��و حتدي��د ج��زء م��ن جمموع��ة البيان��ات ال��ذي نري��د ا�س��تخدامه لعملي��ة اكت�س��اف املعرفة. .10متثيل املعرفة هو عملية ا�ستخراج البيانات من التحليالت من خالل الأمناط.
29
2اذكر ثالثة اأمثلة على ا�ستخدام البيانات ال�سخمة للم�ساعدة يف االأعمال التجارية. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
3ابح��ث يف االإنرتن��ت ع��ن م��زودي خدم��ات احل��س��بة ال�س��حابية االأك��ر �س��هرة الي���م يف ال�س���ق العاملي��ة واملُ�س��تخدمة يف تخزين ومعاجلة البيانات ال�سخمة. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
4ا�س��رح باإيج��از م��دى م�س��اعدة التخزي��ن ال�س��حابي لن��ا يف التعام��ل م��ع م�س��كلة تخزي��ن الك��م الهائ��ل م��ن البيان��ات الناجت عن البيانات ال�سخمة. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
30
5البيانات ال�سخمة هي تط�ر حديث يف تاريخ احل��سبة ،فهل ميكنك حتديد عاملن �ساهما يف هذا النم� املفاجئ يف جمع البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
6ق��ارن ب��ن التقني��ات الث��الث لتخزي��ن البيان��ات ال�سخم��ة ،واإذا قم��ت بتط�ي��ر تطبي��ق يتطل��ب و�س� ً ��ال �س��ري ًعا ج�دًا اإىل البيانات ،فما هي التقنية التي �ستختارها؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
7ملاذا يُعدُّ تقييم اأمناط البيانات مه ًما يف عملية التنقيب عن البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
31
8ا�سرح كيفية عمل قابلية الت��سع يف تخزين البيانات ال�سحابية ،ثم ابحث عن خدمتن لتخزين البيانات �سحاب ًيا على �سبكة االإنرتنت. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
9ما الغر�س من ح�كمة البيانات؟ وهل تعتر ح�كمة البيانات مرادفة الإدارة البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
10ابح��ث يف االإنرتن��ت ع��ن معل�م��ات ح���ل �س�اب��ط اأو ق�ان��ن اإدارة البيان��ات ال�سحي��ة يف اململك��ة العربي��ة ال�س��ع�دية، ثم اذكر الع�اقب املرتتبة على ت�سرب بيانات اأحد مرافق الرعاية ال�سحية؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
32
11اأن�س��ئ تقري� ًرا ع��ن تغ��ري املن��اخ م��ن خ��الل مقارن��ة بيان��ات الطق���س التاريخي��ة لدولت��ن م��ن اختي��ارك ،ث��م ح�دّد اأي��ن �ستبحث عن املعل�مات على االإنرتنت ،وا�سرح الع�امل امل�ؤثرة وراء قرارك هذا. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
12ما خماوف اخل�س��سية التي ميكنك التفكري بها عند تعامل م�ؤ�س�سة كبرية مع البيانات ال�سخمة؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
13ه��ل لدي��ك فك��رة ع��ن املعل�م��ات الت��ي متتلكه��ا �س��بكة الت�ا�س��ل االجتماع��ي الت��ي ان�سمم��ت اإليه��ا ح���ل عائلت��ك واأ�سدقائك؟ اإذا كانت االإجابة نعم ،اكتب قائمة ق�سرية بهذه املعل�مات. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
33
الدر�س الثالث
اأ�سا�سيات علم البيانات علوم الريا�سيات التي حتتاجها لت�سبح عال بيانات
Mathematics Needed to Become a Data Scientist
تتطل��ب خوارزمي��ات عل��م البيان��ات بالإ�ساف��ة اإىل تنفي��ذ التحلي��الت واكت�س��اف الأف��كار م��ن البيان��ات املوج��ودة معرف��ة ريا�سي��ة ،فف��ي ح��ني اأن الريا�سيات ل تعت��رب الأداة الوحي��دة املطلوب��ة لع��امل البيان��ات ولكنه��ا م��ن اأه��م تل��ك الأدوات .اأح��د العنا�سر الأكرث اأهمية يف �س��ري عمل م�س��روع علم البيانات حتديد وفهم حتدي��ات الأعم��ال وحتويلها اإىل حتديات ريا�سية.
اجلرب اخلطي
Linear Algebra
يهت��م اجل��رب اخلط��ي بامل�سفوف��ات واملتجه��ات ،مم��ا ُيع��د اأم� ًرا مه ًم��ا للغاي��ة لأن��ه يف من��اذج عل��م البيان��ات واخلوارزمي��ات يت��م حتوي��ل جمي��ع الأرق��ام واملعلوم��ات اإىل م�سفوف��ات .ويت��م ا�س��تخدام تقني��ة اأخ��رى �سروري��ة يف معاجل��ة البيان��ات ال�سخم��ة و ترتك��ز على اجلرب اخلطي، وه��ي تقني��ة تقلي���ص الأبع��اد .وكذل��ك ُتع��د روؤي��ة احلا�س��ب ( )Computer Visionوالرجم��ة اللغ�ية الع�سبية ( )NLPمن جمالت علم البيانات التي تعتمد ب�سكل كبري على اجلرب اخلطي.
الريا�سيات املتقطعة
Discrete Mathematics
تتخ�س�ص الريا�سيات املتقطعة يف طرق املنطق وال�ستنتاج ،وهي جوانب اأ�سا�سية يف ت�سميم اخلوارزمي��ات و ُتع� ُّد اأ�سا���ص عل��م البيان��ات .وم��ن املج��الت املهم��ة ج��دً ا اخلا�س��ة بالريا�سي��ات املتقطع��ة ه��ي نظري��ة املخطط��ات .ت�س��تخدم املخططات يف منذجة �س��بكات معق��دة للغاية مثل �س��بكات تنظيم اجلينات ،وتعترب درا�س��ة هذه املخططات يف علم البيانات مهمة جدً ا للتقدم يف بع���ص املج��الت مث��ل الط��ب الدقيق وبيولوجيا الأنظمة وغريها الكثري.
االحتماالت واالإح�ساء
Probability and Statistics
عن��د اإن�س��اء البيان��ات بع��د حتليله��ا ،يحت��اج ع��امل البيان��ات اإىل معرف��ة عملي��ة بالإح�س��اء والحتم��الت لك��ي يتمك��ن م��ن فه��م وتف�س��ري تل��ك البيانات .ي�س��تخدم علماء البيانات مقايي���ص مث��ل التباي��ن والرتب��اط والنح��راف املعياري على نطاق وا�س��ع للح�سول على نظرة ثاقبة على العالق��ات الأ�سا�س��ية خل�سائ���ص جمموع��ة البيان��ات.
التفا�سل والتكامل
Calculus
ُيع ُّد متثيل النتائج من حتليل البيانات اأم ًرا بالغ الأهمية لتوفري معلومات م�ستنرية من خالل اإن�ساء الر�سوم واملخططات البيانية. يعترب التفا�سل والتكامل جز ًءا ل يتجزاأ من اخلوارزميات امل�ستخدمة يف العمليات احل�سابية املعق��دة املطلوب��ة له��ذه العملي��ة ،ويتم ا�س��تخدام خ�سائ�ص مثل ال�س��تقاق اجلزئي ،والنحدار اخلطي ،والنزول ال�ستقاقي على نطاق وا�سع يف التطوير والتح�سني وح�ساب اخل�سارة. 34
البايثون يف علم البيانات
Python for Data Science
يف�س��ل حمرتف��و عل��م البيان��ات عام� ًة ا�س��تخدام لغ��ة البايث��ون يف م�س��روعاتهم املخت�س��ة به��ذا اجلانب، فهي لغة برجمة عالية امل�س��توى كائنية التوجه و�س��هلة التعلم ،ومن ال�س��هل البدء يف العمل على م�س��روع م��ا بحي��ث ميكن��ك ب��دء كتاب��ة ك��ود برجم��ي ب�س��يط اأو ت�سمي��م وتنفي��ذ ح��ل با�س��تخدام مب��ادئ الربجم��ة كائني��ة التوجه (.)OOP يوفر ا�س��تخدام واجهات برجمة التطبيقات ( )APIsواملكتبات القيا�س��ية الو�سول اإىل دوال قوية �س��هلة ال�س��تخدام .توج��د العدي��د م��ن املكتب��ات اجلاه��زة لال�س��تخدام يف البايث��ون م��ن ِقب��ل املتخ�س�س��ني يف املوؤ�س�سات املختلفة تغطي جمموعة متنوعة من الحتياجات مثل :ا�ستخراج البيانات ،واإعداد البيانات وحتليلها ،ومعاجلة البيانات ،والنمذجة التنبوؤية ،ومتثيل البيانات ،واإعداد التقارير. كذل��ك ف�اإن مكتب��ات البايثون تدع��م تطبيقات تع ّلم الآل��ة ومتطلبات ال��ذكاء ال�سطناع��ي املتقدمة مبا يتجاوز تطبيقات علم البيانات التقليدية.
مقدمة اإىل مفكرة جوبيرت
البايث�ن (:)Python لغ ��ة برجم ��ة عالي ��ة امل�س ��توى ت�س ��تخدم لأغرا���ص متع ��ددة وق��د اكت�س ��بت �س ��عبية متزاي ��دة ف ��ي عل ��م البيان ��ات وتع ّل��م الآل��ة.
ملف مفكرة
Intro to Jupyter
ميك��ن كتاب��ة اأوام��ر البايث��ون الن�سي��ة يف اأح��د بيئ��ات التطوي��ر املتكامل��ة ( )IDEمث��ل فيج���ل �س��ت�دي� ك���د ( )Visual StudioCodeاأو JetBrains PyCharmاأو ميكن��ك كتابته��ا يف مفك��رة ج�بي��رت (.)Jupyter Notebook تعت��رب مفك��رة جوبي��رت اأح��د تطبيق��ات الوي��ب مفتوح��ة امل�س��در امل�س��تخدمة لتطوي��ر وتق��دمي م�س��روعات عل��م البيان��ات با�س��تخدام البايث��ون .تتي��ح البيئ��ة التفاعلي��ة لعلم��اء البيان��ات اإن�س��اء مفك��رات حمو�سبة ،وتدمج مفكرة جوبيرت اأوامر البايثون وتخرجها يف م�ستند واحد يجمع بني التمثيالت والن�ص ال�س��ردي واملعادلت الريا�سية واأ�س��كال البيانات الأخرى .بعد تثبيت الربنامج ،ميكن ت�س��غيله يف مت�سف��ح الوي��ب اإم��ا عرب الإنرتنت اأو على حا�س��ب �س��خ�سي. تدع��م مفك��رة جوبي��رت اإىل جان��ب البايث��ون اأك��رث م��ن 100لغ��ة برجم��ة يطل��ق عليه��ا ا�س��م اأن�ي��ة ( )kernelsيف بيئ��ة نظ��ام مفك��رة جوبيرت مبا فيها Javaو Rو Juliaو MATLABو OctaveوScheme و Processingو Scalaوغريه��ا. يق��وم تطبي��ق مفك��رة جوبي��رت بت�س��غيل ن��واة IPythonفق��ط ولك��ن ميك��ن تثبيت اأنوي��ة اإ�سافية. �سن�س��تخدم ه��ذا الربنام��ج لتحلي��ل البيان��ات ال�ستك�س��افية لح ًق��ا يف هذا الكتاب ،ويعترب اأحدث تطبيق قائم على الويب ل�س��تخدام مفك��رة جوبي��رت ه��و تطبي��ق JupyterLabبحي��ث تعم��ل جمي��ع امل�س��تندات بنف���ص الطريق��ة يف كلت��ا البيئت��ني.
امل�ستخدم
م�ستعر�ص الويب
خادم جوبيرت
اآيبيثون
IPython
�سكل :1.9هيكلية مفكرة جوبيرت
�سكل :1.10منوذج لقطة �سا�سة من مفكرة جوبيرت
35
اأدوات علم البيانات
Tools for Data Science
عل��م البيان��ات عملي��ة معق��دة تتطل��ب الكث��ري م��ن اخلط��وات لتوف��ري حل��ول لعل��م البيان��ات ،ول��كل خط��وة م��ن خط��وات هذه العملي��ة العديد م��ن الأدوات لإجناز �يوعا ل��كل خط��وة يف عل��م البيان��ات. املهم��ة املطلوب��ة .يعر���ص ج��دول 1.9الأدوات الأك��رث �س� ً
�سكل :1.11لقطة �سا�سة لنموذج بيانات من خالل .IBM Cloud Pak
جدول :1.9االأدوات ال�سائعة لعلم البيانات الغر�س تخزين البيانات
36
اأدوات الربجميات
ق�اعد البيانات حيث يتم تخزين البيانات.
MySQLو SQL Serverو MongoDBو .Neo4j
حتويل �سيغة البيانات
االأدوات التي ت�ستعلم عن البيانات التي تريد حتليلها.
Pythonو SQLو .Apache TinkerPop
النمذجة
البيانات املطل�بة اإىل مناذج منا�سبة للتحليل. حت�يل .
Pandasو NumPyو .Apache Spark
التحليل
العملية التي ت� ِّلد الروؤى املطل�بة.
Tensorflowو PyTorchو IBM Watsonو AWS
الت�سوير
ت�س�ير النتائج يف ال�سكل االأمثل.
Matplotlibو D3.jsو .R
و .Sagemaker
مهن علم البيانات
Data Science jobs
علم البيانات هو اأحد اأ�س��رع التخ�س�سات املتعلقة بعلوم احلا�س��ب من ًوا والأكرث طل ًبا يف يف الوقت الراهن ،وقد ن�س��رت موؤ�س�س��ة م�س��ك موؤخ ًرا تقري ًرا عن �سوق العمل ال�سعودي ووظائف امل�ستقبل ،حيث يركزِّ التقرير على الوظائف الأكرث طل ًبا حال ًيا ،وتبدو الفر�ص الوظيفية يف علم البيانات واعدة ب�سكل خا�ص ل �سيما الوظائف التي تدعم اأهداف روؤية ال�سعودية .2030 اجلدول :1.10املهن املتعلقة بعلم البيانات عال بيانات
مهمته هي اإيجاد البيانات ومعاجلتها وحتليلها لل�سركات وامل�ؤ�س�سات .ياأخذ البيانات االأولية وغري املعاجلة ثم يتم ا�ستخراج روؤى واأمناط من البيانات ت�ساعد ال�سركات وامل�ؤ�س�سات على حتليل اأدائها واتخاذ قرارات مهمة.
مهند�س تعلم اآلة
م�س�ؤول عن تنفيذ حل�ل واأنظمة تع ّلم االآلة لتطبيقات معينة .يجب اأن يك�ن على دراية بهند�سة الرجميات وباالإح�ساء ليتمكن من اختبار احلل�ل واحلكم على �سحة مناذج تع ّلم االآلة الناجتة.
متخ�س�س تعلم اآلة
بينما يخت�س مهند�س� تع ّلم االآلة يف تطبيق مناذج تع ّلم االآلة ،فاإن متخ�س�س تع ّلم االآلة يُركز على اإيجاد اخل�ارزميات الريا�سية املحددة التي تنتج النماذج التي ميكن للمهند�سن ا�ستخدامها بعد ذلك.
معماري تطبيقات
يق�م بت�سميم نظم املعل�مات للم�ؤ�س�سات وال�سركات.
معماري اأنظمة املوؤ�س�سات الكبرية
يجمع بن املعرفة التجارية والتقنية ،وعلى ت�ا�سل م�ستمر بن اأ�سحاب االأعمال واالإدارات الفنية ،ويكلف برتجمة احتياجات بيانات االأعمال وامل�ؤ�س�سات اإىل م�ا�سفات وحل�ل تقنية ُتر�سل اإىل الفرق الفنية.
معماري بيانات
م�س�ؤول عن تخزين و�سري املعل�مات يف �سركة اأو م�ؤ�س�سة .يعمل مع علماء ومهند�سي البيانات لتط�ير طرق نقل البيانات ب�س�رة منا�سبة الإدخال جمم�عة البيانات وحتليلها واإخراج النتائج.
مهند�س بيانات
ي�ساعد مهند�س البيانات يف بناء االإطار الرقمي جلمع البيانات وتخزينها ومعاجلتها ،والتي �سي�ستخدمها علماء البيانات واملحلل�ن يف عملهم.
معماري البنية التحتية
دوره يخت�س يف اإدارة البنية التحتية حيث يتم تخزين البيانات ومعاجلتها ،وياأخذ باالعتبار ع�امل مثل خ�س��سية البيانات واحلماية واأداء البنية التحتية على اخل�ادم حيث يتم حتليل البيانات ،ولقد اأ�سبحت م�سروعات علم البيانات اأكر تعقيدًا ب�سكل عام ،لذلك يحتاج مهند�س� البنية التحتية اإىل التاأكد من اكتمال معاجلة البيانات �سمن اجلداول الزمنية املنا�سبة.
حملل بيانات
ه� حمرتف ياأخذ الروؤى من جمم�عات البيانات املعاجلة ويُن�سئ التقارير والت�س�رات والتحليالت االأخرى املتن�عة والتي تتما�سى مع االأهداف الرئي�سة التي ينبغي للحل املبني على علم البيانات حتقيقها.
37
جمتمعات علم البيانات عرب االإنرتنت
Data Science Online Communities
يرغب علماء البيانات يف البقاء على ات�سال مع اأقرانهم يف هذا املجال اأو يف املهن املماثلة لتعلم اأفكار وطرق جديدة لأن منهجيات وتقنيات علم البيانات دائمة التغري .وتوفر املوارد عرب الإنرتنت لعلماء البيانات الفر�سة فقط يف احلفاظ على وترية معينة ،وهنا برزت احلاجة اإىل وجود جمتمع من خرباء علم البيانات لدعم هذا العمل وظهور جمموعة متنوعة من املنتديات واملجموعات عرب الإنرتنت والتي متكنهم من الت�سال م ًعا وتطوير هذا املجال بكفاءة من خالل امل�ساركة يف جمتمعاته عرب الإنرتنت .ت�ساهد هنا اأبرز املجتمعات رغم اأنه ُيع ُّد ً مفتوحا لظهور جمتمعات جديدة اأخرى قد تكون ناجحة ا ً أي�سا. جمال ً
كاقل
Kaggle
كاق��ل �س��ركة تابع��ة لقوق��ل ،وه��ي اأك��رب جمتمع لعلم البيان��ات ي�سم ماليني الأع�ساء الن�س��طني وجمموعة وا�س��عة من املوارد ،وميكن لعلماء البيانات العث��ور عل��ى جمموع��ات البيان��ات العام��ة وامل��وارد التعليمي��ة وبيئ��ة العم��ل امل�ستندة اإىل جمموعة النظراء لدعم عمل حتليل البيانات اخلا�ص بهم. https://www.kaggle.com
جمتمع بيانات IBM Data Community IBM
جمتم��ع بيان��ات IBMعب��ارة ع��ن منت��دى ع��رب الإنرتن��ت ب��ه مدون��ات خم�س�س��ة لعل��م البيان��ات .ي�س��ت�سيف الأوراق البحثي��ة والب��ث ع��رب الإنرتن��ت والعرو���ص التقدميي��ة الت��ي يت��م حتديثها م��ع تطور ه��ذا املجال. https://community.ibm.com/community/user/datascience
توج��د املزي��د م��ن املجتمع��ات عل��ى الإنرتن��ت املدع��وم بع�سه��ا م��ن ِقب��ل احلكوم��ات ،ويدي��ر البع���ص الآخ��ر متطوع��ون. يركز البع�ص ب�سكل اأكرب على اجلانب الجتماعي من خالل الجتماعات وج ًه��ا لوج��ه ،بينم��ا يرك��ز البع���ص الآخ��ر عل��ى الأك��واد الربجمي��ة املطلوب��ة مل�سروعات علم البيانات.
�سكل :1.12ال�سفحة الرئي�سية ملوقع Kaggle.com
جدول :1.11املجتمعات عرب االإنرتنت مركز علم البيانات ()Data science center
https://www.datasciencecentral.com/
تبادل املكد�س ()Stack Exchange
https://datascience.stackexchange.com/
جمتمع علم البيانات ()Data science community
https://dssberkeley.com/
بيانات مدفوعة ()Driven Data
https://www.drivendata.org/
جمتمع البيانات ()Data Community DC
https://www.datacommunitydc.org/
جمتمع رديت 38
()Reddit Society
https://www.reddit.com/r/datascience/
تذ َّك��ر دائ ًم��ا اأن تتحق��ق م��ن دق��ة البيان��ات اأو االأك��واد اأو االأدوات ع��رب االإنرتنت قبل ا�ستخدامها، حتق��ق ا ً أي�س��ا م��ن ت�ساري��ح اال�س��تخدام القانوني��ة ل��كل جمموع��ة بيان��ات وح��اول تنزي��ل اأدوات الربامج مبا�سر ًة من ملفات مطوريه��ا.
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1يتم حتويل جميع الأرقام واملعلومات اإىل م�سفوفات يف مناذج وخوارزميات تع ّلم الآلة.
.2لكي يتمكن عامل البيانات من فهم وتف�سري البيانات عند اإن�ساءها ،فاإنه يحتاج اإىل معرفة عملية بالإح�ساء والحتمالت.
.3تتخ�س�ص الريا�سيات املتقطعة يف طرق املنطق وال�ستنتاج ،وهي جوانب اأ�سا�سية يف ت�سميم اخلوارزمية والتي تُع ُّد الأ�سا�ص لتع ّلم الآلة.
.4بع�ص املجتمعات على الإنرتنت مدعومة من قبل احلكومات ،والبع�ص الآخر يديره متطوعون.
.5مهند�ص الأنظمة هو ال�سخ�ص الذي ي�سمم اأنظمة املعلومات للموؤ�س�سات وال�سركات.
.6عامل البيانات هو حمرتف ياأخذ الروؤى من جمموعات البيانات التي متت معاجلتها ويقوم باإن�ساء تقارير وت�سورات وحتليالت اأخرى متنوعة تتما�سى مع الأهداف الرئي�سة التي حتتاج اإىل حل مبني على علم البيانات لتحقيقها. .7حملل البيانات هو حمرتف م�سوؤول عن تخزين وتدفق املعلومات يف �سركة اأو موؤ�س�سة ،ويعمل مع علماء ومهند�سي البيانات لبناء طرق نقل البيانات املنا�سبة لإدخال جمموعة البيانات وحتليلها واإخراج النتائج.
39
ّ 2 و�سح كيف ُمت ّكن لغة البايث�ن من م�ساعدة املتخ�س�س يف علم البيانات. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ِّ 3 و�سح كيف ميكن ل�ج�بيرت ن�ت ب�ك م�ساعدة املتخ�س�س يف علم البيانات. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
4عدِّد اأهم اأدوات علم البيانات ،وكيف ميكن لكل اأداة امل�ساهمة يف كل خط�ة من خط�ات علم البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
40
5مل��اذا يعت��ر فه��م االإح�س��اء مه��ارة اأ�سا�س��ية لع��امل البيان��ات؟ وه��ل ميكن��ك التفك��ري يف مث��ال يت�سم��ن حتلي��ل البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
6البايث�ن هي لغة برجمة متعددة اال�ستخدامات ،فهل ُتعدُّ كافية مل�سروعات عل�م البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
7ابح��ث ع��ن ث��الث مكتب��ات البايث���ن حتظ��ى ب�س��عبية كب��رية ب��ن علم��اء البيان��ات عل��ى االإنرتن��ت ،ث��م ا�س��رح باخت�سار �س��بب ذلك. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
41
8قارن بن بيئة التط�ير املتكاملة و بيئة ج�بيرت ن�ت ب�ك ،ثم اذكر االختالفات الرئي�سة بينهما؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
9عل��ى فر���س اأن��ك ع��امل بيان��ات جدي��د تتق��ن لغ��ة البايث���ن ،فم��ا االأدوات االأخ��رى الت��ي حتتاجه��ا م��ن اأدوات عل��م البيانات؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
10ي�ج��د يف ه��ذا الدر���س قائم��ة بامله��ن املتعلق��ة بعل��م البيان��ات ،ف�اأي منه��ا ّ تف�س��ل؟ ومل��اذا؟ وم��ا التحدي��ات الت��ي تعتق��د باأنك �ست�اجهها يف هذه املهنة؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
11قم بزيارة اأحد جمتمعات علم البيانات عر االإنرتنت وابحث عن دورة تدريبية ب�سيطة للدرا�سة الذاتية لتعزيز معرفتك بعلم البيانات ،ثم قم بتقييم مدى مالءمة الدورة التدريبية مل�ست�ى معرفتك. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
42
امل�سروع 1
تو ّف��ر ال�س��بكات الجتماعي��ة كمي��ات هائل��ة م��ن املعلوم��ات كل ي��وم .ح��دِّ د ثالث��ة اإج��راءات يومي��ة تنت��ج بيان��ات خا�س��ة مفي��دة به��ذه ال�س��بكات.
2
ف ّكر يف الأمور التالية على وجه التحديد: ما اأنواع البيانات التي يتم جمعها؟ هل جميع هذه البيانات متاحة للجمهور؟
3
قم باإعداد �س��رائح لعر�ص خماطر انتهاك اخل�سو�سية املتعلقة بو�س��ائل التوا�سل الجتماعيِّ ، وو�سح كيف ميكن حماية امل�ستخدمني ،واذكر اأف�سل اخلطوات التي ميك��ن اتخاذه��ا لتتجن��ب اأن ت�سب��ح بيانات��ك معلوم��ات مفي��دة ميك��ن لالآخري��ن ا�ستغاللها؟
43
ماذا تعلمت
املق�سود بعلم البيانات. الفرق بني البيانات واملعلومات واملعرفة. كيفية التمييز بني علم البيانات وذكاء االأعمال والذكاء اال�سطناعي. تعريف دورة حياة علوم البيانات. املق�سود بالبيانات ال�سخمة. كيفية م�ساهمة البايثون اأو االأدوات االأخرى يف علم البيانات.
الم�سطلحات الرئي�سة ت�س�ير البيانات م�ست�دع البيانات التحليل اال�ستك�سافي للبيانات معل�مات الح��سبة في الذاكرة مفكرة ج�بيتر المعرفة البايث�ن بيانات اأولية القيمة التن�ع ال�سرعة الم�ث�قية الحجم
44
Data Visualization Data Warehouse Exploratory Data Analysis Ιnformation In-Memory Computing Jupyter Notebook Knowledge Python Raw Data Value Variety Velocity Veracity Volume
ذكاء ا�سطناعي البيانات ال�سخمة ذكاء االأعمال التخزين ال�سحابي البيانات تحليل البيانات محلل البيانات تنظيف البيانات جمع البيانات بحيرة بيانات التنقيب في البيانات تجهيز البيانات علم البيانات دورة حياة علم البيانات عالم البيانات
Artificial Intelligence Big Data Business Intelligence Cloud Storage Data Data Analysis Data Analyst Data Cleaning Data Collection Data Lake Data Mining Data Preparation Data Science Data Science Life Cycle Data Scientist
45
.2جمع البيانات والتحقق من �سحتها �يتعرف الطال��ب يف ه��ذه الوح��دة عل��ى مفاهي��م جم��ع البيان��ات �س� ّ وط��رق التحق��ق م��ن �سحتها. وي�س��مل ذل��ك معنى جم��ع البيانات واأمناطها املختلف��ة و م�سادرها. و�سيتم التطرق اإىل مو�سوع ترميز البيانات والرتكيز على ميزات وعي��وب ه��ذه الط��رق ،ويف اخلت��ام �س��يتعرف الطال��ب عل��ى خط��وات التحق��ق م��ن �سحة البيانات واأمناطها.
اأهداف التعلم
بنهاية هذه الوحدة �سيكون الطالب قاد ًرا على اأن: يعرف م�سطلح جمع البيانات. ّ ي�سنّف م�سادر البيانات. ي�سنّف معايري جودة املعلومات. يعرف مفهوم من�سات البيانات املفتوحة. ّ يتعرف على اأهمية احل�سول على الت�ساريح القانونية املنا�سبة قبل ّ البدء بجمع البيانات. يحدد االأمناط املختلفة للبيانات. يعرف املق�سود برتميز البيانات. ّ ُيط ّبق خطوات التحقق من �سحة البيانات. ي�سنّف الطرق املتنوعة للتحقق من �سحة اإدخال البيانات.
46
الدر�س االأول
جمع البيانات جمع البيانات
Data Collection
تُع ُّد مرحلة جمع البيانات ( )Data Collectionاأهم مراحل البحث العلمي اأو درا�س��ة ظاهرة معينة، ُومتثل هذه املرحلة عملية جمع احلقائق والأرقام وامل�سطلحات للمتغريات امل�ستهدفة يف ذلك البحث اأو الدرا�سة .ميكن جمع البيانات با�ستخدام اأجهزة خمتلفة مثل اأجهزة ال�ست�سعار وت�سجيل البيانات. عام��الت قيد الدرا�س��ة ،بالإ�ساف��ة اإىل التخطيط والعمل تتطل��ب عملي��ة جم��ع البيان��ات فه ًم��ا عمي ًق��ا لل ُم ِ ال��دوؤوب للح�س��ول عل��ى بيان��ات عالي��ة اجل��ودة ،حيث ت�س��هم البيانات عالية اجل��ودة يف اإجراء التحليل املنا�سب لأداء املهام على الوجه املطلوب وذلك ل�ستخراج معلومات مفيدة حول الظاهرة قيد الدرا�سة. تختل��ف ط��رق جم��ع البيان��ات باخت��الف ن��وع البيان��ات ،ولك��ن يظ��ل التحق��ق م��ن �سح��ة ودق��ة اخلط��وات هاما. املتعلق��ة بجمع البيان��ات اأم ًرا ً
جمع البيانات (:)Data Collection
ه��ي عملي��ة جم��ع الق��راءات اأو احلقائ��ق وقيا�س��ها ،وت�س��مل احل�س��ول عل��ى البيان��ات وت�س��ميتها وحت�س��ينها.
ال�سكل :2.1مهند�ص يجمع بيانات حول حالة الطق�ص
مثال تع��د معرف��ة حال��ة الطق���س م��ن اأه��م االأم���ر املتعلق��ة باال�س��تعداد لل�س��فر .ميك��ن ا�س��تخدام العدي��د م��ن االأجه��زة لدرا�س��ة الع�ام��ل املتعلق��ة باملن��اخ ،ومنه��ا اأجه��زة قيا���س درج��ة احل��رارة ومقيا���س �س��دة و�س��رعة الري��اح ومقيا���س درج��ة الرط�ب��ة. البيانات التي يتم جمعها من هذه االأجهزة هي قيم درجة احلرارة ،وح�ساب �سرعة الرياح واجتاهاتها ،ون�سبة بخار املاء يف اجل�. 47
م�سادر البيانات
Sources of Data
يوج��د ت�سنيف��ان اأ�سا�س��يان مل�س��ادر البيان��ات :م�س��ادر البيان��ات الرئي�س��ة ( ،)Primary data sourcesوم�س��ادر البيان��ات الثان�ي��ة
(.)Secondary data sources
م�سادر البيانات الرئي�سة
Primary Data Source
يحت��وي م�س��در البيان��ات الرئي�س��ة عل��ى بيان��ات مل تم��ع م��ن قب��ل وميك��ن جمعه��ا من خالل اأجه��زة الإ�ست�س��عار واأجه��زة ت�س��جيل البيان��ات وكذل��ك م��ن خ��الل ال�س��تبانات .م��ن الأمثل��ة التي تدل على م�سادر البيانات الرئي�سة :مقيا�ص درجة احلرارة الذي يجمع بيانات درجة حرارة الهواء ،ومقيا�ص �سرعة الرياح الذي يقي�ص �سرعة الرياح ،وكذلك فاإن اإجراء ا�ستبانة للعم��الء ح��ول طبيع��ة الطق���ص ال��ذي يف�سلون��ه عند ال�س��فر للخارج ُيع ُّد م�س��د ًرا من م�سادر البيانات الرئي�سة. مقيا�س �سرعة الرياح ه� جهاز ي�ستخدم لح�ساب ال�سرعة في حركة الرياح ،حيث تدفع الرياح الناتجة عن حركة اله�اء الزعانف الثالثة للمقيا�س مما يت�سبب في دورانها ،مما ي�ؤدي اإلى دوران المح�ر المركزي الذي يت�سل بم�لد كهربائي .تف ّعل الطاقة الناتجة عن هذا الم�لد ،عداد كهربائي يتم معايرته لعر�س �سرعة الرياح.
م�سادر البيانات الثانوية
ال�سكل :2.2مقيا�ص �سرعة الرياح
Secondary Data Source
حت�س��ل عل��ى ه��ذا الن��وع م��ن البيان��ات م��ن خ��الل ا�س��تخدام بيان��ات اأخرى من م�سدر البيانات الرئي�ص .فعلى �سبيل املثال ،ميكنك ا�ستخدام بيانات درج��ة ح��رارة اله��واء و�س��رعة الري��اح م��ن جه��ازي ا�ست�س��عار خمتلف��ني عام��ل اآخ��ر ي�س��مى درج��ة ح��رارة الري��اح الب��اردة للح�س��ول عل��ى بيان��ات ملُ ِ ( .)wind-chill temperatureميك��ن ح�س��اب تل��ك الدرج��ة با�س��تخدام �سيغة ح�ساب درجة حرارة الرياح الباردة ،والتي تتمثل يف �سرب �سرعة الرياح باملعام��ل 0.7ث��م ط��رح الن��اجت م��ن درج��ة ح��رارة اله��واء الت��ي مت ت�س��جيلها. بعبارة اأخرى ميكنك ا ًأول ا�ستخدام مقايي�ص درجة احلرارة ومقايي�ص الرياح كم�سادر بيانات اأولية حل�س��اب بيانات درجة احلرارة و�س��رعة الرياح ،ثم ميكنك ا�ستخدام �سيغة ح�ساب درجة الربودة كم�سدر بيانات ثانوي من اأج��ل احل�سول على بيان��ات درجة الربودة.
ال�سكل :2.3املوقع الإلكرتوين اخلا�ص بتوقعات حالة الطق�ص
اجلدول :2.1اأوجه االختالف بني م�سادر البيانات الرئي�سة والثانوية م�سادر البيانات الرئي�سة
48
م�سادر البيانات الثانوية
االأ�سالة
يتم جمعها مبا�سرة من م�سادرها االأ�سلية.
ال تعتر بيانات اأ�سلية الأنها تعتمد على بيانات اأخرى مت جمعها من قبل اآخرين.
ال�سكل
تك�ن ب�س�رة خام وغري مع ّرفة.
تك�ن ب�س�رة منظمة ومعاجلة.
الدقة
اأكر دقة لك�نها بيانات حالية.
اأقل دقة الأنها مرتبطة باأحداث ما�سية.
امل�سدر
يتم جمعها ب�ا�سطة اأجهزة اال�ست�سعار ،اال�ستبانات ،املقابالت والتجارب وغريها.
التكلفة
عالية التكلفة وتتطلب الكثري من ال�قت جلمعها.
يتم جمعها من الكتب واملجالت وامل�ستندات وال�سفحات االإلكرتونية واملدونات وغري ذلك. اأقل تكلفة واأقل ا�ستهال ًكا لل�قت.
م�سادر البيانات الداخلية واخلارجية
Internal and External Data Sources
ميك��ن ت�سني��ف م�س��ادر البيان��ات اإىل م�س��ادر داخلي��ة وخارجي��ة .تعك���ص م�س��ادر البيان��ات الداخلي��ة تل��ك البيان��ات الت��ي يت��م جمعه��ا داخل ًي��ا م��ن قبل جهة العمل اأو اجلهة امل�س�وؤولة عن جمع البيانات ،بينما البيانات اخلارجية هي التي يتم حت�سيلها من خارج جمال جهة العمل .وعلى �س��بيل املثال ،تعترب البيانات التي يتم جمعها من جهاز ا�ست�سعار تابع جلامعة اأو موؤ�س�سة علمية بيانات داخلية ،بينما تعترب البيانات التي يتم احل�سول عليه��ا م��ن موؤ�س�س��ات اأخ��رى اأو اأف��راد اأو من م�س��ادر خارج اجلامعة بيانات خارجية.
جودة املعلومات
Information Quality
عندما تتم معاجلة البيانات اأو تنظيمها اأو تقدميها يف �سياق معني فاإنها ت�سمى معلومات ،وتو�سف قيمتها ل�ستخدام معني باأنها "جودة املعلومات". تُعد جودة املعلومات ً عامال مه ًما يف قيمة تلك املعلومات ومدى م�سداقيتها لال�ستخدام يف اتخاذ القرارات .ومع زيادة جمع وحفظ البيانات ،اأ�سبحت جودة املعلومات الناتة عن معاجلتها ذات اأهمية كبرية ومتزايدة .ي�ساعد �سمان جودة املعلومات على التحديد الدقيق لالحتياجات الفعلية لتنفيذ امل�سروعات ،وكذلك توجيه اخلدمات ب�سكل فعال ،وزيادة الكفاءة يف العمل .وباملقارنة ميكن اأن تت�سبب املعلومات غري الدقيقة يف حدوث خلل يف الأعمال، وتقلل من الكفاءة وتوؤدي اإىل التاأخري يف اإجناز امل�س��روعات .ميكن التحقق من جودة املعلومات من خالل معايري حمددة ت�س��مى معايري اجل�دة ( ،)Quality standardsوهي مو�سحة يف ال�سكل التايل: الكفاية ()Completeness
الدقة ()Precision
املالءمة ()Appropriateness م�ست�ى التفا�سيل ()Level of Detail
الت�قيت ()Timeliness
ال�سكل :2.4معايري جودة املعلومات
فيما يلي بع�س االأ�سئلة التي ميكن اأن ت�ساعدك يف التحقق من دقة املعلومات: هل ميكن التحقق من احلقائق واالإح�ساءات واملعل�مات من م�سادر اأخرى؟ هل ميكن تكرار التجربة التي مت احل�س�ل على البيانات منها؟ وهل لها نف�س النتائج؟ ما م�سدر املعل�مات؟ ملاذا مت اإن�ساء املعل�مات؟ هل تبدو املعل�مات دقيقة بنا ًء على معرفتك وخرتك؟ هل تت�سمن املعل�مات اأخطاء اإمالئية اأو اأحر ًفا يف غري مكانها؟ وهل االقتبا�سات التي مت اال�ست�سهاد بها �سحيحة؟ 49
قب��ل جم��ع اأي ن��وع م��ن املعلوم��ات م��ن خ��الل موق��ع اإلك��رتوين وقب��ل ال�س��روع يف اخلط��وة التالي��ة يف عل��م البيان��ات (وهي خط��وة املعرفة) ،يج��ب عليك التحقق قدما يف ا�س��تخراج من جودة املعلومات التي نحن على و�س��ك احل�سول عليها من املوقع .اإذا كانت املعلومات لي�س��ت موثوقة ،فال ميكنك بكل تاأكيد امل�سي ً املعرف��ة ،وه��ذا يعن��ي اأن��ه يجب التحقق من املعلومات باتباع معايري اجلودة اخلم�س��ة التالية: تكمن اأهمية معايري اجلودة اخلم���ص هذه يف اأنها ت�س��اعدك على التحقق من موثوقية كل املعلومات التي تدها يف املواقع الإلكرتونية.
ا ً أوال :الدقة
Accuracy
الدق��ة ه��ي التاأك��د م��ن �سح��ة املعلوم��ات ،ويج��ب اأن تك��ون املعلوم��ات �سحيح��ة لك��ي ُتع� ّد عالية اجل��ودة .ويتم التحق��ق م��ن دقته��ا م��ن خ��الل امل�س��ادر املوثوق��ة ،حي��ث ي�س��هل التاأك��د م��ن خلوها م��ن الأخطاء احل�س��ابية اأو اللغوي��ة اأو غريه��ا م��ن الأخطاء.
ثان ًيا :املالءمة
Appropriateness
يجب اأن تكون املعلومات مرتبطة مبو�سوعك اأو بال�س�وؤال البحثي ،فكلما كانت املعلومات متعلقة مبا تبحث عنه ،كلما كانت مالءمتها اأف�سل .يوؤدي احل�سول على معلومات اإ�سافية ل تتعلق مبا تبحث عنه اإىل اإ�ساعة الوقت يف حماولة العثور على املعلومات املطلوبة.
ثال ًثا :التوقيت
Timeliness
ُيع� ُّد تاري� � ��خ ن�س��ر املعلوم��ات ج��ز ًءا مه ًم��ا ،حي��ث يو�س��ح م��دى حداث��ة املعلومات ومنا�س��بتها ملو�س��وع البحث، ولذل��ك يج��ب التاأك��د م��ن احل�س��ول عل��ى اآخ��ر حتدي��ث للمعلوم��ات ،ويج��ب علي��ك التحق��ق دائ ًما م��ن م�سدر املعلومات.
راب ًعا :م�ستوى التفا�سيل
Level of detail
ُحتدد جودة املعلومات اأي�سا من خالل النظر اإىل م�ستوى التفا�سيل التي تقدمها تلك املعلومات. ُيع� ُّد وج��ود الكث��ري م��ن التفا�سي��ل عل��ى املعلومات املطلوب��ة اأم ًرا �سع ًبا ،بينما توؤدي قلة التفا�سيل اإىل �سعوبة فهم املعلومات .ويعتمد م�ستوى التفا�سيل على امل�سكلة ودرا�ستها ،فاإذا كانت ب�سيطة فاإنك حتتاج اإىل م�ستوى عال من التفا�سيل. قليل من التفا�سيل ،واإذا كانت معقدة فاإنك حتتاج اإىل م�ستوى ٍ اإن املقدار ال�سحيح من املعلومات هو معيار اأ�سا�سي جلودتها.
خام�سا :الكفاية ً
Completeness
مقيا�سا مه ًما لل�سمولية املطلوبة للتاأكد من اأن املعلومات املقدمة تعطي تُع ُّد كفاية املعلومات ً �سورة كاملة عن الواقع .اإن عدم احل�سول على جميع املعلومات املطلوبة يعني اأنك لن تتمكن من ا�ستخدامها ب�سكل �سحيح ،مما يعني اأن جودة تلك املعلومات �سعيفة وغري كاملة ول ميكن اتخاذ القرارات ال�سحيحة بنا ًء على تلك املعلومات. 50
عند ا�ستخدام معيار التوقيت يجب مراعاة االأمور التالية: التحقق من ت�اريخ امل�سادر امل�ستخدمة. التحقق من الت�اريخ اخلا�سة باحلق�ق الفكرية مثل ت�سجيل العالمات التجارية امل�سجلة ،وحق�ق الن�سخ والن�سر ،وبراءات االخرتاع ،واالأ�سرار التجارية. التحقق من تاريخ مراجعة اأو حترير املعل�مات. التحقق من تاريخ الن�سر.
يُعدُّ الم�قع االإلكتروني الخا�س بالمركز ال�طني لالأر�ساد ً مثاال للعث�ر على المعل�مات التي تلبي المعايير الخم�سة المحددة لج�دة المعل�مات الم��سحة اأعاله.
ال�سكل :2.5مثال على م�سدر معلومات
من�سات البيانات املفتوحة
Open Data Platforms
من�س��ات البيان��ات املفتوح��ة ه��ي من�س��ات تدع��م و�س��ول امل�س��تخدمني ملجموع��ات البيان��ات املفتوح��ة. تق��دم من�س��ات البيان��ات املفتوح��ة النموذجي��ة بيانات املوؤ�س�س��ة التي ت�س��ت�سيف هذه املن�سة. ت�س��ت�سيف اجله��ات احلكومي��ة اأو املوؤ�س�س��ات غ��ري الربحي��ة من�س��ات البيان��ات املفتوح��ة الت��ي تتي��ح و�س��ول اجلمه��ور اإىل البيان��ات .وعل��ى وج��ه التحدي��د فاإنه��ا تق��وم بجم��ع البيان��ات وتنظيمها با�س��تمرار م��ن جمموع��ة متنوع��ة م��ن القطاع��ات العام��ة .وميك��ن ا�س��تخدام جمموع��ات البيان��ات ه��ذه دون تكلفة مالية اأو حتديات تقنية للو�سول اإليها .كما ميكن اإعادة ا�ستخدام البيانات املفتوحة واإعادة توزيعها مع مراعاة املتطلبات التي يفر�سها ترخي�ص البيانات .وميكن ا ً أي�سا ا�ستخدامها من قبل مواطني الدول الأخرى .قد تقدم ال�س��ركات ا ً أي�سا بيانات مفتوحة من خالل برامج امل�س�وؤولية الجتماعية لل�س��ركات. هذه بع�ص ال�س��تخدامات ال�س��ائعة ملن�سات البيانات املفتوحة: ال�سفافية يف اإعداد املوازنة احلكومية والإنفاق على خدمات الدولة. اإح�سائيات اأداء املوؤ�س�سات احلكومية. بيان��ات اأداء خمتل��ف القطاع��ات العام��ة للدول��ة كالتعلي��م والرعاي��ة ال�سحي��ة والنق��ل ،والت��ي ميك��ن ا�س��تخدامها يف اإج��راء الأبح��اث الت��ي ُت��ربز الأداء العام داخل هذه الدولة. ميكن دمج جمموعات البيانات م ًعا وا�ستخدامها يف تطبيقات اأخرى. ميك��ن العث��ور عل��ى من�س��ة البيان��ات املفتوحة احلكومية يف اململكة العربية ال�س��عودية على عنوان املوقع الإلكرتوين:
ال�سكل :2.6البوابة الوطنية للبيانات املفتوحة يف اململكة العربية ال�سعودية
https://data.gov.sa/
51
خ�سو�سية البيانات
Data Privacy
معني ،مثل ا�س��م م�سطل��ح "البيان��ات ال�س��خ�سية" ُيطل��ق عل��ى البيان��ات املتعلق��ة بالأ�س��خا�ص وه��ي تل��ك البيان��ات الت��ي م��ن خاللها يتم حتديد هوية �س��خ�ص ّ ال�سخ�ص وعائلته ورقم هاتفه ورقم الهوية .اأدّت عملية تو�سع و�سائل التوا�سل الإلكرتوين اإىل زيادة يف املخاطر املتعلقة باخل�سو�سية والتي عليك حماية نف�سك منها ،وتت�سمن خ�سو�سية البيانات قدرة ال�سخ�ص على اأن يقرر بنف�سه متى وكيف واإىل اأي مدى ميكن م�ساركة معلوماته ال�سخ�سية مع الآخرين اأو تزويد الآخرين بتلك املعلومات.
االأذونات القانونية جلمع وا�ستخدام البيانات Legal Permissions to Collect and Use Data
يتطل��ب جم��ع البيان��ات وا�س��تخدامها يف امل�س��روعات البحثي��ة توف��ر الت�ساري��ح القانوني��ة املنا�س��بة ،وع��ادة م��ا يق��وم جمل���س املراجع��ة امل�ؤ�س�س��ية ( )IRBيف املوؤ�س�س��ات مبراجع��ة مقرتح��ات امل�س��روعات البحثي��ة قب��ل الب��دء به��ا لتحدي��د م��ا اإذا كان امل�س��روع يتب��ع املب��ادئ الأخالقي��ة واللوائ��ح القانوني��ة .تختل��ف ه��ذه الت�ساريح يف طبيعتها ،ولكن العاملني الرئي�سني اللذين يجب اأخذهما بعني العتبار هما املوقع الذي �سيتم فيه تخزين البيانات ،وموقع امل�ستفيدين الذين �سيتعاملون مع تلك البيانات .حتتاج ال�سركات واملوؤ�س�سات اإىل التاأكد من اأن اخلدمات التي تمع البيانات وت�ستخدمها متوافقة قانون ًيا مع قوانني بلدانها.
مثال يجب على م�ستخدمي البيانات التي يتم ا�ست�سافتها على من�سة البيانات املفت�حة يف اململكة العربية ال�سع�دية ا�ستخدام هذه البيانات وفق �سروط �سيا�سة البيانات املفت�حة https://data.gov.sa/ar/policies
البحث املوجه ومقارنة البيانات
Targeted Research and Data Comparison
يت��م ا�س��تخدام البح��ث املوج��ه للرتكي��ز عل��ى ق�ساي��ا معين��ة ظه��رت من البحث الرئي���ص .فعلى �س��بيل املثال اإذا ا�س��تخدمت قيم درجة احل��رارة والرياح للتنبوؤ بالطق�ص يف مدينة ما ،ثم لحظت اأن مناطق معينة من هذه املدينة �سجلت قي ًما ق�سوى لدرجات احلرارة ،يتعني عليك يف هذه احلالة اإجراء بحث حول تلك املناطق لتقييم تاأثري العوامل الأخرى على درجة احلرارة فيها. يتم اإجراء مقارنة البيانات عند وجود اأكرث من جمموعة بيانات م�سجلة لنف�ص املنطقة يف فرتات زمنية متماثلة .على �سبيل املثال ،قد يكون لديك جمموعة بيانات لقيم درجات احلرارة امل�سجلة ملدينة جدة يف مار�ص 2021وجمموعة اأخرى م�سجلة يف مار�ص .2022وبوجود جمموعتي البيانات هاتني ،ميكنك ب�سهولة اإجراء مقارنة البيانات من اأجل اكت�ساف التغريات يف درجات احلرارة اأو التغريات خالل �سنوات.
ال�سكل � :2.7سيا�سة البيانات املفتوحة
52
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1جمع البيانات هو عملية جمع وقيا�ص القراءات اأو احلقائق. .2هناك نوعان من الت�سنيفات الأ�سا�سية مل�سادر جمع البيانات :الرئي�سة والثانوية. .3يعترب تاريخ ن�سر املعلومات من اأهم معايري جودة املعلومات. .4املالءمة تعني اأنه كلما كانت املعلومات لي�ست ذات �سلة مبا يتم البحث عنه ،كانت جودتها اأ�سواأ. .5تعترب م�ستويات التفا�سيل والدقة معايري جودة للمعلومات. .6ت�ساعدك معايري اجلودة اخلم�ص يف التحقق من موثوقية املعلومات. .7لي�ص للحكومة �سلطة على من�سات البيانات املفتوحة. .8تختلف الت�ساريح القانونية جلمع وا�ستخدام البيانات بنا ًءا على عدة متغريات. .9يتم ا�ستخدام البحث املوجه عندما نريد الرتكيز على ق�سايا حمددة ظهرت من بحثنا الأ�سا�سي. .10ميكن اإجراء مقارنة البيانات عندما يكون لديك اأكرث من جمموعة بيانات واحدة مع بيانات م�سجلة من نف�ص املنطقة ومن فرتات زمنية مماثلة.
53
2قارن ب�س�رة خمت�سرة بن م�سادر البيانات الرئي�سة والثان�ية. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
�ِ 3س ْف باخت�سار كل �سمة ج�دة ميكن ا�ستخدامها للتحقق من ج�دة املعل�مات. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
أعط ً مثاال على البحث امل�جه ومقارنة البيانات. 4ا ِ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
54
5قارن بن م�سادر البيانات الرئي�سة والثان�ية يف حالة الطق�س مع طرح بع�س االأمثلة. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
ُ 6زر من�س��ة البيان��ات املفت�ح��ة data.gov.saوابح��ث ع��ن املعل�م��ات املتعلق��ة باحل�س���ل عل��ى ت�ساري��ح با�س��تخدام تل��ك البيان��ات .ه��ل هن��اك اأي ا�س��تثناء؟ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
55
7ابح��ث عل��ى االإنرتن��ت ع��ن من�س��ات البيان��ات املفت�ح��ة يف البل��دان االأخ��رى ،وه��ل ميكن��ك العث���ر عل��ى معل�مات �س��خ�سية عر هذه املن�سات؟ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
8ح��دد م�قع��ن عل��ى االإنرتن��ت اأحدهم��ا حك�م��ي واالآخ��ر خا���س ،ث��م ق��ارن ب��ن ج�دة املعل�م��ات بينهما بنا ًء على املعايري اخلم�س التي تعرفت عليها. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
56
الدر�س الثاين
اأنواع البيانات البيانات الرقمية والبيانات الفئوية
Numerical Data and Categorical Data
بع��د اأن تعرف��ت عل��ى مفه��وم البيان��ات؛ الآن �س��تتعرف عل��ى اأمناطه��ا املختلف��ة .ميك��ن اأن تتخذ البيانات عدة اأ�س��كال :مثل ع��دد زوار حدث معني ،اأو مدة تلك الزي��ارة ،اأو غ��ري ذل��ك .يف الدرا�س��ات البحثي��ة ،ثم��ة نوع��ان اأ�سا�س��يان من البيانات وهما :البيانات الرقمي��ة والبيانات الفئوية.
البيانات الرقمية
Numerical Data
تتك��ون البيان��ات الرقمي��ة م��ن حقائ��ق قابل��ة للقيا���ص ،كع��دد الفعالي��ات املختلف��ة يف مدين��ة ما. وميكن للبيانات الرقمية اأن تكون منف�سلة اأو ت�سل�س��لية.
البيانات املنف�سلة
رقمية 50 6.25
Discrete Data
متث��ل البيان��ات املنف�سل��ة عنا�س��ر قابل��ة للع��د ميكنه��ا اأن تاأخ��ذ قي ًم��ا معين��ة فق��ط ،مث��ل ع��دد الطلب��ة يف الف�سل.
البيانات الت�سل�سلية
-10 0003756
ال�سكل :2.8البيانات الرقمية
Continuous Data
البيان��ات الت�سل�س��لية متث��ل بيان��ات ميك��ن قيا�س��ها وميكنه��ا اأن تاأخ��ذ اأي قيم��ة ،مث��ل ط��ول ال�س��خ�ص.
البيانات الفئوية
Categorical Data
البيان��ات الفئوي��ة ه��ي ن��وع بيان��ات غ��ري كمي��ة ،ميكن تخزينها وحتديدها بنا ًء على الأ�س��ماء اأو الت�سميات املعطاة لها .وميكن اأن تو�سف هذه البيانات على اأنها ا�سمية اأو ترتيبية.
البيانات اال�سمية
Nominal Data
يت��م تعري��ف البيان��ات ال�س��مية عل��ى اأنه��ا بيان��ات تُ�س��تخدم لت�س��مية املتغ��ريات اأو تو�س��يمها، دون حتديد قيمة كمية لها اأو و�سعها يف ترتيب معني .على �سبيل املثال :ميكن ت�سنيف نتائج اختب��ا ٍر م��ا ا�س��م ًيا" :ناج��ح" اأو "را�س��ب".
البيانات الرتتيبية
Ordinal Data
فئ�ية ناجح را�سب A B C
ال�سكل :2.9البيانات الفئوية
البيان��ات الرتتيبي��ة ه��ي ن��وع م��ن البيان��ات الفئوية التي تتب��ع ترتي ًبا معي ًنا .يتم فرز جمموعات البيانات الرتتيبية وف ًقا لنظام ت�سنيف حمدد .على �سبيل املثال :ميكن فرز نتائج اختبار ما برتتيب تنازيل ح�سب الدرجة A :ثم Bثم Cثم Dثم .F 57
البيانات الر�سومية اأو بيانات مقاطع ال�سوت اأو الفيديو
بيانات ر�س�مية
Graphical, Video and Audio Data Types
عل��ى الرغ��م م��ن اأن البيان��ات ع��ادة م��ا تكون يف �س��كل اأبجدي رقمي (ن�سو���ص واأرقام ورموز) ،اإل اأنها قد تتكون من �سور اأو مقاطع �سوتية اأو مقاطع فيديو .فيما يلي بع�ص الأنواع الأخرى من البيانات:
البيانات الر�سومية
Graphical Data
تتكون البيانات الر�سومية من خمططات ور�سوم بيانية وغري ذلك .على �سبيل املثال :جمموعة ال�سور اخلا�س��ة باملع��امل ال�س��ياحية ملنطق��ة حم��ددة ،اأو الر�س��م البي��اين اخلا�ص باأعداد ال��زوار لأحد الأماكن ال�سياحية يف اململكة العربية ال�سعودية.
بيانات ال�سور ومقاطع الفيديو
Audio Data
تتك��ون البيان��ات ال�سوتي��ة م��ن الأ�س��وات وكذل��ك املوؤث��رات ال�سوتي��ة املختلف��ة كالت�س��جيالت ال�سوتي��ة الإر�س��ادية يف املتاحف والأماكن ال�س��ياحية املختلفة يف اململكة العربية ال�س��عودية.
البيانات الثابتة واملتغرية
بيانات مقاطع الفيدي�
Image and Video Data
قد تكون ال�سورة الرقمية �سورة اأو ر�س ًما تو�سيح ًيا يتم متثيله بوحدات البك�سل اأو باملتجهات .تتكون بيانات الفيديو من �سل�سلة من ال�سور املتحركة وال�سوت ومن الأمثلة عليها الإعالن التلفزيوين حلملة �سياحية ،اأو مقطع فيديو عن بوليفارد الريا�ص ،اأو بث فيديو مبا�سر من قناة القراآن الكرمي اأو مرا�سم احل��ج يف اململك��ة العربي��ة ال�س��عودية وم��ا اإىل ذلك.
البيانات ال�سوتية
ال�سكل :2.10البيانات الر�سومية
ال�سكل :2.11بيانات ال�سور ومقاطع الفيديو
بيانات �س�تية
Static and Dynamic Data
ق��د تبق��ى البيان��ات عل��ى حالتها الأ�سلية بعد ت�س��جيلها وق��د تتغري اأحيا ًنا ،ولذلك ميكن متثيل البيانات ب�سكل ثابت اأو متغري.
ال�سكل :2.12البيانات ال�سوتية
مثال على البيانات المتغيرة
البيانات الثابتة
Static Data
البيانات الثابتة هي البيانات التي ل تتغري بعد ت�سجيلهاً ، مثال البيانات التي حتتويها جملة مطبوعة حول الأماكن ال�سياحية يف اململكة العربية ال�سعودية ،فبمجرد طباعة املجلة ل ميكن تغيري املعلومات فيها.
البيانات املتغرية (الديناميكية)
Dynamic Data
البيان��ات املتغ��رية ه��ي البيان��ات الت��ي ق��د تتغ��ري بع��د ت�س��جيلها ويج��ب حتديثها با�ستمرار .على �سبيل املثال بيانات موقع اإلكرتوين يحتوي على معلومات عن الأماكن ال�سياحية يف اململكة العربية ال�سعودية ،حيث ميكن حتديثها عند احلاجة. 58
ال�سكل :2.13موقع البنك املركزي ال�سعودي
ترميز البيانات
Data Coding
اإن البيان��ات الت��ي مت احل�س��ول عليه��ا م��ن التج��ارب اأو م��ن خ��الل الدرا�س��ات ال�س��تق�سائية ه��ي بيان��ات يف �سورته��ا الأولي��ة ويف الغال��ب حتت��اج اإىل ترمي��ز. تتيح عملية الرتميز تنظيم البيانات وترتيبها بطريقة حمددة وذلك با�ستخدام رموز خمتلفة مثل الأرقام اأو احلروف اأو الكلمات الق�سرية ،والتي ت�سف �س��يا ًقا معي ًن��ا اأو تع� ّ�رب ع��ن عب��ارة اأو فق��رة باأكمله��ا ،وفيم��ا يل��ي اأمثل��ة م��ن احلي��اة اليومية حيث تُ�س� َتخدَ م الرموز لتمثي��ل البيانات:
رموز املطارات
Airport Codes
و�س��ع احت��اد النق��ل اجل���ي ال��دويل ( )IATAرم��زً ا مكو ًن��ا م��ن ثالث��ة ح��روف يح��دد العدي��د م��ن املطارات حول العامل .ميكنك البحث عن تذاكر الط��ريان عل��ى الإنرتن��ت با�س��تخدام رم��ز املط��ار ،وميكن��ك مالحظ��ة الرمز كذلك على بطاقات الأمتعة التي يتم اإل�ساقها باحلقائب عند ت�س��ليمها يف مكاتب ت�سجيل املغادرة باملطار ا�ستعدادًا لركوب الطائرة؛ مما يتيح �سحن الأمتعة للوجهة املق�سودة ،كما يظهر الرمز على بطاقات الأمتعة املرفقة يف مكاتب ت�س��جيل الو�سول باملطار؛ لتوفري ال�س��المة يف حالة فقدان الأمتعة.
رموز العمالت
Currency Codes
ل��كل بل��د يف اأنح��اء الع��امل عمل��ة خا�س��ة ب��ه ،وت�س��تخدم رم��وز العم��الت ب� ً �دل م��ن ا�س��م العمل��ة كاخت�س��ارات متعارف عليها عن��د التعامالت املالية.
اجلدول :2.2رموز املطارات الرموز
التف�سري
DMM
مطار امللك فهد الدويل
JED
مطار امللك عبد العزيز الدويل
RUH
مطار امللك خالد الدويل
اجلدول :2.3رموز العمالت الرموز
التف�سري
SAR
الريال ال�سع�دي
USD
الدوالر االأمريكي
EUR
الي�رو
ال�سكل :2.14رموز العمالت
اجلدول :2.4مزايا ترميز البيانات املزايا اإدخال اأ�سرع للبيانات
التف�سري من االأ�سهل كتابة الرمز ً RUH بدال من كتابة مطار امللك خالد الدويل.
تاأخذ م�ساحة اأقل
من ال�سعب كتابة اال�سم الكامل للبلد على الل�حات اأو على و�سائل النقل العام مثل �سيارات االأجرة واحلافالت، ولكن ي�سبح االأمر ً �سهال مع رم�ز ت�سجيل املركبات الدولية.
ت�سري����ع عملية البحث عن البيانات
لكل منطقة رمزها اخلا�س .يُ�ستخدم هذا الرمز للبحث عن عن�ان ح�سب رمز املنطقة ،ورقم ال�سارع ،واملبنى ،كما ي�ستخدمه مكتب الريد لت�سهيل ت�زي ��ع ر�سائل الريد. 59
اجلدول :2.5عيوب ترميز البيانات التف�سري
العيوب معنى غام�س للبيانات
قد جتد �سع�بة يف التمييز بن الرم�ز املت�سابهة.
�سعوبة فهم الرتميز
قد يك�ن من ال�سعب تف�سري اأو تذكر معنى الرمز.
الرموز امل�ستخدمة قد ُت�ستنفد
الرموز ال�سريطية
مثال قد يك�ن عدد العنا�سر املراد ترميزها كبريا جدا بحيث ال تكفي جمم�عة االأحرف لرتميزها، ف ُتدمج االأرقام واحلروف اأو ت�ستخدم االأرقام الط�يلة وهذا يعقّد عملية الرتميز ،مثل ترميز املنتجات اال�ستهالكية يف املتاجر.
Barcodes
ترى الرموز ال�س��ريطية يف كل مكان حولك وب�س��كل يومي ،فمثال تدها مطبوعة على التذاكر الإلكرتونية واملنتجات يف حمالت البقالة وغريها. الرم��ز ال�س��ريطي ه��و مل�س��ق ب��ه خط��وط �س��وداء رفيع��ة اإىل جان��ب جمموع��ة متنوع��ة من الأرقام .تُ�س��تخدم يف تنظيم املعلومات وفهر�س��تها اأو و�سع عالمة على اأ�س��عار املنتجات.
يتحقق اآخر رقم من قراءة جميع االأرقام االأخرى ب�سكل �سحيح بوا�سطة املا�سح ال�سوئي (.)scanner
ت�سف االأرقام ال�ستة التالية املنتج.
حتدد االأرقام ال�ستة االأوىل ال�سركة التي ت�سنع املنتج اأو تبيعه.
ال�سكل :2.15مثال على الرموز ال�سرطية
رقم الكتاب املعياري الدويل )ISBN (International Standard Book Number
يوج��د رق��م عل��ى غ��الف معظ��م الكت��ب (مث��ل الكتي��ب الإر�س��ادي) اأعل��ى الرم��ز ال�س��ريطي ُي�س��مى رق��م الكت��اب املعي��اري ال��دويل ( )ISBNوه��و رق��م فريد ي�ستخدمه النا�سرون واملكتبات وحمالت بيع الكتب لتحديد عناوين الكتب واإ�سداراتها .يتكون رقم الكتاب املعياري الدويل من ثالثة ع�سر خانة ع�س��رية ويق�س��م اإىل خم���ص جمموعات متتالية من الأرقام. 60
اجلدول :2.6هيكل ISBNاملكون من 13رق ًما الو�سف
جمموعة االأرقام رقم البادئ
يتك�ن من ثالثة اأرقام اإما تك�ن 978اأو .979بالن�سبة لكتب اململكة العربية ال�سع�دية فاإن الرقم البادئ ه� .978
رقم الت�سجيل
يتك�ن من رقم واحد اأو قد ي�سل اإىل خم�سة اأرقام وي�ستخدم كمع ِّرف للبلد .وبالن�سبة لكتب اململكة العربية ال�سع�دية فاإن رقم الت�سجيل ه� 603اأو .9960
رقم املُ�سجل
قد ي�سل اإىل �سبعة اأرقام وي�ستخدم لتحديد النا�سر.
رقم الن�سر
قد ي�سل اإىل �ستة اأرقام وي�ستخدم لتحديد اإ�سدار حمدد ،وال�سكل لعن�ان حمدد.
رقم التحقق
يتك�ن من رقم واحد وي��سع دائ ًما يف النهاية ،وي�ستخدم للتحقق من �سحة باقي االأرقام.
مثال فيما يلي مثال على رمز ،ISBNحيث ي�سري كل عن�سر اإىل جزء معن من املعل�مات ح�ل الدليل.
رقم الن�سر
رقم التحقق
رقم الت�سجيل
رقم ال ُم�سجل
الرقم البادئ
ISBN: 978 603 508 929 6
ال�سكل :2.16مثال على ISBNاملكون من 13رق ًما
رموز اال�ستجابة ال�سريعة QR Codes
رم��ز اال�س��تجابة ال�س��ريعة ( )Quick Response QRه��و مبثاب��ة اجلي��ل الث��اين م��ن الرم��ز ال�س��ريطي (،)barcode ال�س ْ مك والذي يتكون من خطوط �سوداء متجاورة وخمتلفة ُ ويحتوي على مزيد من املعلومات .قد ي�سري رمز ال�ستجابة ال�س��ريعة اإىل حمت��وى اإلك��رتوين مث��ل :املواق��ع الإلكرتونية، اأو مقاطع الفيديو ،اأو امللفات الرقمية ،وميكن قراءة هذا الرمز با�ستخدام كامريات الهواتف الذكية.
ي�سير رمز اال�ستجابة ال�سريعة هذا اإلى رابط الم�قع االإلكتروني: https://www.visitsaudi.com ال�سكل :2.17مثال على رموز ال�ستجابة ال�سريعة
61
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي: .1البيانات الفئوية هي نوع كمي من البيانات. .2يتم تعريف البيانات الرتتيبية على اأنها البيانات امل�ستخدمة لت�سمية املتغريات اأو تو�سيمها. .3متثل البيانات املنف�سلة عنا�سر قابلة للعد وميكن اأن تاأخذ قي ًما معينة فقط. .4رموز املطارات ورموز العمالت هي اأمثلة على ترميز البيانات. .5البيانات الثابتة هي البيانات التي قد تتغري بعد ت�سجيلها ويجب حتديثها با�ستمرار. .6البيانات املتغرية (الديناميكية) هي البيانات التي ل تتغري بعد ت�سجيلها. .7غال ًبا ما يتم اإجراء ت�سفري البيانات على البيانات يف �سكلها الأويل ،والتي يتم احل�سول عليها من التجارب اأو من خالل ال�ستطالعات. .8يتكون رقم ISBNمن 10جمموعات متتالية من الأرقام. .9الرمز ال�سريطي عبارة عن مل�سق به خطوط �سوداء رفيعة ،مع جمموعة متنوعة من الأرقام. .10يتكون رمز ال�ستجابة ال�سريعة من مربعات �سوداء حتتوي على معلومات.
62
�سحيحة
خاطئة
�ِ 2س ْف باخت�سار البيانات الثابتة والبيانات املتغرية. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
3اذكر بع�س االأمثلة على منتجات مميزة برم�ز �سريطية اأو رم�ز اال�ستجابة ال�سريعة. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
ِّ و�سح باخت�سار املق�س�د برتميز البيانات. 4 ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
63
5ابح��ث ع��ن م�ق��ع الك��رتوين ميك��ن م��ن خالل��ه اإن�س��اء رم���ز QRجماني��ة ،واأن�س��ئ رم��ز QRلل�سفح��ة الرئي�سة لذلك امل�قع ،ول�سفحة ويب اأخرى مل�قع الكرتوين من اختيارك .هل ميكنك مالحظة االختالفات يف املربع��ات ال�س���داء ل��كل رم��ز QR؟ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
6حتتفظ املنظمة الدولية للت�حيد القيا�سي بالقائمة الر�سمية لرم�ز الدول من خالل معيار ).(ISO 3166 ابح��ث ع��ن رم���ز دول جمل���س التع��اون اخلليج��ي ) (GCCاملك�ن��ة م��ن حرف��ن .ه��ل ميكن��ك اإعط��اء اأمثل��ة عل��ى ا�ستخدام هذه الرم�ز؟ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
7ابحث عن رمز ISBNلهذا الكتاب ،وهل ميكنك حتديد اأرقام الدولة والنا�سر؟ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
64
الدر�س الثالث
التحقق من �سحة اإدخال البيانات
التحقق من �سحة اإدخال البيانات Data Entry Validation
ي�س��ري مفه��وم التحق��ق م��ن �سح��ة اإدخ��ال البيان��ات اإىل اأي ن�س��اط يتحق��ق م��ن اأن البيان��ات املدخلة تنبثق م��ن جمموع��ة م��ن القي��م املعتم��دة ،وتتواف��ق م��ع القواعد املقبولة للبيانات ،وقد تتب��ع تلك البيانات بع�ص العمليات والإجراءات الت�سحيحية ،وتهدف عملية التحقق من �سحة البيانات اإىل �سمان الدقة واجلودة، وتنفذ من خالل اإن�ساء عدة فحو�سات ل�سمان الت�ساق املنطقي للبيانات املدخلة واملخزنة .ويتم قبول البيان��ات يف ح��ال توافقه��ا م��ع القوان��ني ،ويت��م تاه��ل ورف���ص البيانات يف حال عدم اللت��زام بالقوانني.
التحقق من �سحة البيانات: ه��ي عملي��ة �سم��ان دق��ة وج��ودة البيان��ات ويت��م تنفيذه��ا ع��ن طري��ق ع��دة فحو�س��ات للتاأك��د م��ن التنا�س��ق املنطق��ي للبيان��ات املدخل��ة واملخزن��ة.
على �سبيل املثال ،ميكن اأن يرتاوح النطاق املقبول لقيم درجة حرارة الهواء امل�سجلة من جهاز ا�ست�سعار درجة احلرارة من �سالب 89.2درجة مئوية (اأدنى درجة حرارة) اإىل 58درجة مئوية (اأعلى درجة حرارة) ،ويجب اأال ي�سجل جهاز اال�ست�سعار قيم درجة حرارة الهواء مثل 100 درجة مئوية ،حيث ي�سري ظهور مثل هذا النوع من البيانات يف نتائج جهاز اال�ست�سعار امل�سجلة اإىل حدوث خلل ويجب رف�س القيمة.
اأنواع التحقق من �سحة اإدخال البيانات
Types of Data Entry Validation
يوجد العديد من اأنواع التحقق التي ميكن ا�س��تخدامها للتاأكد من �سحة البيانات املدخلة ،كما ميكن ا�س��تخدام برامج مثل مايكرو�س���فت اإك�س��ل ( )Microsoft Excelللتحق��ق م��ن �سح��ة البيان��ات املدخل��ة. تتب��ع معظ��م اأ�س��اليب التحق��ق م��ن �سح��ة اإدخ��ال البيان��ات طريق��ة اأو اأك��رث م��ن ط��رق التحق��ق اأدن��اه للتاأك��د م��ن اأن البيان��ات �سحيح��ة قب��ل تخزينها. �يوعا ه��ي :التحق��ق م��ن البح��ث ،والتحق��ق م��ن التواج��د ،والتحق��ق م��ن الط��ول ،والتحق��ق م��ن النط��اق ،والتحقق م��ن ال�سيغة، واأك��رث ه��ذه الط��رق �س� ً والتحق��ق من النوع.
مثال على التحقق من �سحة البيانات في اإك�سل.
ال�سكل :2.18مثال على التحقق من �سحة البيانات يف اإك�سل
65
اجلدول :2.7اأنواع التحقق من �سحة البيانات: النمط
الو�سف
التحقق من البحث
ي�ساعد على تقليل االأخطاء با�ستخدام قائمة حمدودة النطاق حتت�ي على قيم مدخلة م�سبقًاً . فبدال من كتابة ا�سم املطار، ميكن مل�ظف �سركة الطريان اختيار املطار من قائمة حتت�ي على رم�ز املطارات ح�ل العامل .هذا الن�ع من التحقق ي�ساعد على ادخال البيانات ب�سرعة وبن�سبة اأخطاء اأقل.
التحقق من التواجد
يجعل عملية االإدخال اإلزامية يف اخللية مما ي�سمن عدم تركها فارغة .يجب اإدخال البيانات الهامة؛ واإال فاإن هناك م�سكلة يف تكامل البياناتً ، مثال ال ميكن ترك احلق�ل اخلا�سة با�سم ال�سخ�س وا�سم عائلته فارغة.
التحقق من الطول
يهدف اإىل التاأكد من اأن الرم�ز واحلروف ُتدخل بنطاق ط�ل حمددً . مثال اأرقام ISBNاأو رم�ز العمالت اأو رم�ز البلدان ISOلها ط�ل ثابت مك�ن من 13و 3و 2رق ًما اأو حر ًفا ،على الت�ايل.
()Lookup check
()Presence check
()Length check
التحقق من النطاق ()Range check
التحقق من ال�سيغة ()Format check
التحقق من النوع ()Type check
يُ�ستخدم للتاأكد من اأن االأرقام املُدخلة تقع �سمن نطاق معن وي�سمل حدين هما :احلد االأق�سى ()Maximum limit
واحلد االأدنى ( ،)Minimum limitفمثال اإذا كنت تريد اإدخال عمر ال�سخ�س ،فيجب على النظام قب�ل االأرقام امل�جبة بحد اأعلى 140فقط ،واأي �سيء اآخر يتجاوز هذا النطاق َ�سيُعدُّ بيانات غري �ساحلة. يُ�ستخدم للتاأكد من اأن البيانات تاأتي ب�سيغة حمددة م�سبقًا ولن ي�سمح باأي �سيغة اأخرى يتم اإدخالها يف اخللية .تك�ن عمليات التحقق هذه مفيدة عند ا�ستخدام حق�ل البيانات للرم�ز الريدية اأو اأرقام اله�اتف .يف كلتا احلالتن ،يت�قع النظام تن�سيق بيانات حمدد للغاية. ي�سمن اإدخال امل�ستخدمن لن�ع القيمة ال�سحيح يف حقل حمدد .فمثال اإذا مت متييز حقل البيانات على اأنه حقل رقمي، فلن تتمكن من تخزين قيمة ن�سية.
رقم التحقق Check Digit
يت��م ا�س��تخدام رق��م التحق��ق للتاأك��د م��ن �سح��ة البيان��ات يف الأرق��ام ذات الط��ول الثاب��ت. ميكن اأن يتكون رقم التحقق من خانة اأو خانتني اإ�سافيتني للرقم ،وي�ستخدم رقم التحقق على نطاق وا�سع يف التطبيقات امل�سرفية حيث حتتاج احل�سابات امل�سرفية اإىل التحقق م��ن اأرق��ام التعري��ف الت��ي يت��م اإدخالها يدو ًيا وتخ�سع لفح�ص ب�س��يط للك�س��ف عن اخلطاأ، و حت�س��ب اخلوارزمي��ة رق��م التحق��ق م��ن الأرق��ام الأخ��رى للرق��م ال��ذي مت اإدخال��ه وتقارنه بالأرقام املكتوبة. اإذا كان هناك رقم مفقود اأو متت كتابته ب�سكل خطاأ ،ف�سيعر�ص النظام حتذي ًرا للتحقق م��ن �سح��ة البيان��ات .تت�سم��ن اأرق��ام ISBNواأرق��ام التذاك��ر وجمموع��ة كب��رية م��ن الرموز ال�س��ريطية رق��م حتق��ق .يف ال�س��نوات الأخ��رية ت�ساءل��ت اأهمي��ة رقم التحق��ق نظ ًرا لإدخال البيانات ب�س��كل اآيل عرب املا�س��حات والكامريات والطرق الآلية الأخرى. 66
رقم التحقق ال�سكل :2.19رقم التحقق يف ISBN
مثال على التحقق من �سحة البيانات
Data Validation Example
يوجد العديد من التطبيقات والربامج التي ميكن ا�ستخدامها للتحقق من �سحة البيانات املدخلة ،مثل برنامج مايكرو�سوفت اإك�سل� .ستن�سئ ورقة بيانات يف برنامج مايكرو�سوفت اإك�سل من اأجل تطبيق التحقق من �سحة البيانات التي تعلمتها يف اجلزء النظري. افرت���ص اأن��ك تعم��ل كوكي��ل �س��ياحي ،وتري��د عم��ل حمل��ة �س��ياحية ملدينت��ي الريا���ص وج��دة حي��ث �س��تقام فعالي��ات اأو اأح��داث مهم��ة ط��وال العام ،وم��ن العوامل املهمة يف تنظيم احلملة ال�سياحية اأن تكون على دراية باأحوال الطق�ص يف كل مدينة؛ من اأجل ا�سعار ال�سياح لال�ستعداد لهذه الظروف وال�ستمتاع باحلدث ب�سكل اأف�سل. ٍ ب�سفت��ك وكي��ل �س��ياحي ،زرت م�ق��ع املرك��ز ال�طن��ي لالأر�س��اد ( )https://ncm.gov.saوح َّمل��ت بيان��ات درج��ات احل��رارة وهط��ول الأمط��ار ملدينت��ي ج��دة والريا�ص .افتح برنامج مايكرو�سوفت اإك�سل واأن�سئ ورقة ت�سمى "الطق�ص والأحداث يف اململكة العربية ال�سعودية" لإدخال هذه البيانات .قم باإن�ساء خم�سة اأعمدة بعنوان الأ�سهر واملدينة ودرجة احلرارة العظمى (درجة مئوية) ،ومتو�سط هطول الأمطار (املليمرت) وعدد الأحداث .عليك برجمة القيم املحددة للتحقق من �سحة البيانات يف كل عمود ،وبعد ذلك �سيتعني عليك اإدخال البيانات التي ح�سلت عليها من موقع املركز الوطني لالأر�ساد كما يف اجلدول التايل: اجلدول :2.8الطق�س واالأحداث يف اململكة العربية ال�سعودية االأ�سهر
املدينة
درجة احلرارة العظمى (درجة مئوية)
متو�سط هطول االأمطار (املليمرت)
عدد االأحداث
يناير
جدة
28.8
12.50
2
يناير
الريا�س
20.7
14.80
5
فرباير
جدة
29.8
3.30
1
فرباير
الريا�س
23.7
8.30
8
مار�س
جدة
25.5
2.60
1
مار�س
الريا�س
28
19.90
7
اأبريل
الريا�س
33.6
23.70
1
مايو
جدة
30.7
0.10
1
مايو
الريا�س
39.5
5.60
1
يونيو
جدة
38.2
0.00
1
يوليو
جدة
39.4
0.40
2
�سبتمرب
الريا�س
32.8
0.00
4
اأكتوبر
الريا�س
27.5
1.50
4
نوفمرب
جدة
27.6
27.10
1
نوفمرب
جدة
20.4
20.00
5
67
ميكن تلخي�ص اإجراءات التحقق من �سحة البيانات التي �سيتم اتباعها كما يف املخطط التايل:
التحقق من البحث
القيم املحددة م�سبقا من عمود "ال�سهر".
التحقق من التواجد
التاأكد من اأن كل خلية لها قيمة م�سجلة.
التحقق من الطول
يجب اأن تتكون اأ�سماء املدن امل�سجلة من ثالثة اإىل �ستة حروف.
التحقق من النطاق
يجب اأن ترتاوح قيم درجة احلرارة امل�سجلة من 20اإىل 45درجة مئوية.
التحقق من ال�سيغة
يجب اأن تكون قيم هطول الأمطار م�سجلة ب�سيغة رقم ع�سري.
التحقق من النوع
يجب اأن تكون القيم رقمية فقط.
ال�سكل :2.20اإجراءات التحقق من �سحة البيانات
68
التحقق من �سحة البحث والتواجد يف اإك�سل
Lookup and Presence Validation Check in Excel
لتنفي��ذ التحق��ق م��ن �سح��ة البح��ث والتواج��د عل��ى العم��ود الأول بعن��وان "ال�س��هر"� ،س��تقوم باإ�ساف��ة جمي��ع اأ�س��ماء الأ�س��هر كقي��م ُحمددة ومرتبة م�س��ب ًقا لكي ي�ستطيع امل�ستخدم اإدخالها مبجرد البحث عن كل �سهر من القائمة� .ست�ستخدم نافذة التحقق من �سحة البيانات بحيث ل ي�ستطيع الربنامج قبول اخلاليا الفارغ��ة والت��ي تعن��ي اأن اخلالي��ا ب��دون قيم��ة. لبدء التحقق من �سحة البيانات يف اإك�سل: > انتقل اإىل ورقة "الطق�س واالأحداث يف اململكة العربية ال�سع�دية" يف اإك�سل1 . > حدد اخلاليا من A3اإىل 2 .A17 > ثم اخرت عالمة التبويب بيانات (3 .)Data > م��ن جمموع��ة اأدوات البيان��ات ( 4 ،)Data toolsا�سغ��ط عل��ى ناف��ذة التحق��ق م��ن �سح��ة البيان��ات (5 .)Data Validation > �ستظهر نافذة التحقق من �سحة البيانات (6 .)Data Validation 3 4
5
6
2
1 ال�سكل :2.21بدء التحقق من �سحة البيانات يف اإك�سل
69
لتطبيق التحقق من �سحة البحث والت�اجد يف اإك�سل: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (1 ،)Data Validation اخ��رت عالم��ة التبوي��ب اإع��دادات (2 .)Settings > من مرب��ع ال�سماح ( ،)Allowاخرت قائمة (3 .)List > م��ن مرب� ��ع امل�س��در ( ،)Sourceاكت��ب اأ�س��ماء الأ�س��هر واف�س��ل ب��ني كل واحد والآخر بفا�سلة منقوطة "؛"4 . > األغ حتديد خيار جتاهل الفراغ (5 .)Ignore Blank من املهم جدا منع امل�ستخدم من اإدخال نوع خاطئ من البيانات ،ولهذا الغر�س ت�سع ر�سائل تنبيه اإىل اخلطاأ واإدخال غري �سالح حتى يتم تذكري امل�ستخدم اأثناء عملية اإدخال البيانات.
1 2 5
3
4
يتم التحقق من البحث عندما ت�سيف اأ�سماء االأ�سهر في مرب��ع الم�سدر (.)Source
يتم التحقق من الت�اجد عندما تلغي تحديد الخيار تجاهل الفراغ (.)Ignore Blank
ال�سكل :2.22تطبيق التحقق من �سحة التواجد والبحث يف اإك�سل
1 لتعين ر�سالة اإدخال غري �سالح: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (1 ،)Data Validation اخ��رت عالم��ة التبوي��ب ر�س��الة اإدخ��ال (2 .)Input Message > يف مرب��ع العن�ان )Title:( :اكتب "اإر�سادات اإدخال البيانات"3 . > يف مرب� ��ع ر�س��الة اإدخ��ال ( ،)Input messageاكت��ب "اخ��رت اأح��د الأ�س��هر من القائمة"4 .
2
3 4
ال�سكل :2.23تعيني ر�سالة اإدخال غري �سالح
1
2
لتعين ر�سالة خطاأ: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب تنبي��ه اإىل خط �اأ (2 .)Error Alert > من مرب��ع النمط ( ،)Styleاخرت اإيقاف (3 .)Stop > يف مرب��ع العن�ان ،)Title:( :اكتب "املدخالت غري �ساحلة"4 . > يف مرب� ��ع ر�س��الة خط �اأ ( )Error messageاكت��ب "يج��ب اأن تخت��ار اأحد الأ�سهر من القائمة"5 . > ا�سغط على م�افق (6 .)OK 1
4
3
5
6 ال�سكل :2.24تعيني ر�سالة تنبيه اإىل اخلطاأ
70
بع��د اأن انتهي��ت م��ن اإج��راء التحق��ق م��ن �سح��ة البح��ث والتحق��ق م��ن �سح��ة التواجد ،ميكنك البدء يف اإدخال البيانات يف اجلدول .ففي كل خلية من A3اإىل A17ميكن��ك روؤي��ة قائم��ة من�س��دلة تعر���ص قي��م اأ�س��هر حم��ددة م�س��ب ًقا وميكن��ك اإم��ا كتاب��ة ا�س��م ال�س��هر اأو الختي��ار فق��ط م��ن القائمة املن�س��دلة .عند اإدخال قيم الأ�سهر �سيتم عر�ص ر�سالة الإدخال "اإر�سادات اإدخال البيانات" ،اأما اإذا كتبت قيمة اأخرى مل يتم ت�سمينها يف قائمة القيم املحددة �ساب ًقا يف عمود ال�سهر ،ف�ستظهر ر�سالة اخلطاأ التي عينتها م�سب ًقا على ال�سا�سة.
�ستظهر ر�سالة االإدخال ب�س�رة دائمة اأثناء كتابتك اأ�سماء االأ�سهر داخل عم�د "ال�سهر". يمكنك اأن ترى القائمة المن�سدلة التي تعر�س قيمة ال�سهر المحدد �ساب ًقا، ويمكنك اإما كتابة ا�سم ال�سهر اأو االختيار فقط من القائمة المن�سدلة. ال�سكل :2.25قائمة الأ�سهر املن�سدلة
اإذا كتبت عن طريق الخطاأ �سي ًئا ما في عم�د ال�سهر لم يتم ت�سمينه في قائمة القيم المحددة �ساب ًقا ،ف�سيعر�س اإك�سل ر�سالة الخطاأ التي عينتها اأثناء التحقق من ال�سحة. ال�سكل :2.26ر�سالة تنبيه اإىل اخلطاأ اخلا�سة بالتحقق من �سحة املدخالت
71
�سكل :2.27جدول التحقق من �سحة البيانات
72
بعد اإدخال جميع اأ�سماء االأ�سهر يف اخلاليا A3اإىل � ،A17سيظهر جدول "الطق�س واالأحداث يف اململكة العربية ال�سعودية" على هذا النحو يف ورقة االإك�سل.
التحقق من �سحة الطول يف اإك�سل
Length Validation Check in Excel
اب��داأ العم��ل يف اإدخ��ال اأ�س��ماء امل��دن يف عم��ود "املدين��ة" ،وقب��ل اإدخ��ال اأ�س��ماء امل��دن حتق��ق م��ن الط��ول؛ حت��ى تتمك��ن م��ن اإدخ��ال قي��م ت��رتاوح ب��ني 3اإىل 6
ح��روف فقط.
لتطبيق التحقق من �سحة الط�ل يف اإك�سل: > انتقل اإىل ورقة "الطق�س واالأحداث يف اململكة العربية ال�سع�دية" يف اإك�سل1 . > حدد اخلاليا من B3اإىل 2 .B17 > ثم اخرت عالمة التبويب بيانات (3 .)Data > م��ن جمموع��ة اأدوات البيان��ات ( 4 ،)Data toolsا�سغ��ط عل��ى ناف��ذة التحق��ق م��ن �سح��ة البيان��ات (5 .)Data Validation > �ستظهر نافذة التحقق من �سحة البيانات (6 .)Data Validation 3 4
5
6
2
1 ال�سكل :2.28بدء عملية التحقق من �سحة البيانات
73
لتطبيق التحقق من �سحة الط�ل يف اإك�سل: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (1 ،)Data Validation اخ��رت عالم��ة التبوي��ب اإع��دادات (2 .)Settings > من مرب��ع ال�سماح ( ،)Allowاخرت ط�ل الن�س (3 .)Text Length > من مرب��ع بيانات ( ،)Dataاخرت بن (4 .)Between > يف مرب� ��ع احل��د االأدن��ى ( ،)Minimumاكت��ب الرق��م 3ويف مرب� ��ع احل��د االأق�س��ى ( )Maximumاكت��ب الرق��م 5 .6 > األغ حتديد خيار جتاهل الفراغ (6 .)Ignore blank
1
2
3
6 4 5
ال�سكل :2.29تطبيق التحقق من �سحة الطول يف اإك�سل
1
2
لتعين ر�سالة اإدخال غري �سالح: > من نافذة حتقق من �سحة البيانات ( 1 ،)Data Validationاخرت عالمة التبويب ر�سالة اإدخال (2 .)Input Message > يف مرب��ع العن�ان ،)Title:( :اكتب "اإر�سادات اإدخال البيانات"3 . > يف مرب� ��ع ر�س��الة اإدخ��ال ،)Input message:( :اكت��ب "دخ��ل ا�س��م مدين��ة ي��رتاوح ب��ني 3اإىل 6اأح��رف"4 .
3 4
ال�سكل :2.30تعيني ر�سالة اإدخال غري �سالح
2
لتعين ر�سالة تنبيه اإىل اخلطاأ: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب تنبي��ه اإىل اخلط �اأ (2 .)Error Alert > من مربع النمط ( )Styleاخرت اإيقاف (3 .)Stop > يف مربع العن�ان ( )Title:اكتب "املدخالت غري �ساحلة"4 . > يف مرب��ع ر�س��الة خط �اأ ( )Error messageاكت��ب "يج��ب اأن يك��ون ا�س��م املدين��ة ي��رتاوح ب��ني 3اإىل 6اأح��رف"5 . > ا�سغط م�افق (6 .)OK
1
1
3 4 5 6
نمط اإ�سارة التحذير ( )Warningال ي�سجع على اإدخال بيانات غير �سالحة .رمز ر�سالة الخطاأ مثلث اأ�سفر مع عالمة تعجب �س�داء. يعلن نمط المعل�مات ( )Informationعن اإدخال بيانات غير �سالحة .رمز ر�سالة الخطاأ ه� فقاعة ن�س بي�ساء الل�ن ،بحرف "� "Iسغير اأزرق الل�ن. 74
ال�سكل :2.31تعيني ر�سالة تنبيه اإىل اخلطاأ
بع��د النته��اء م��ن اإج��راء التحق��ق م��ن �سح��ة الط��ول ،ميكن��ك الب��دء يف اإدخ��ال بيان��ات امل��دنُ ،ي�س��مح ل��ك يف كل خلي��ة م��ن B3اإىل B17كتاب��ة ا�س��م املدين��ة بحي��ث يتك��ون م��ن 3اإىل 6اأحرف. تظه��ر ر�س��الة الإدخ��ال با�س��تمرار واإذا اأدخل��ت ع��ن طري��ق اخلط�اأ قيم��ة اأق��ل م��ن 3اأح��رف اأو اأكرث من 6اأحرف ،ف�س��تظهر ر�س��الة اخلطاأ الت��ي قمت بتعيينها �ساب ًقا على ال�سا�سة. �ستظهر ر�سالة االإدخال دائ ًما اأثناء كتابة اأ�سماء المدن في عم�د "المدينة"
ال�سكل :2.32ر�سالة الإدخال ور�سالة تنبيه اإىل اخلطاأ للتحقق من �سحة الطول
اإذا كتبت عن طريق الخطاأ قيمة في عم�د المدينة ال يت�افق مع المعايير التي حددتها بالفعل ،ف�سيعر�س اإك�سل ر�سالة الخطاأ التي عينتها اأثناء التحقق من ال�سحة.
75
�سكل :2.33جدول التحقق من �سحة البيانات
76
بعد ا�ستكمال ادخال جميع بيانات املدن يف اخلاليا B3اإىل � ،B17سيظهر جدول "الطق�س واالأحداث يف اململكة العربية ال�سعودية" على هذا النحو يف ورقة االإك�سل.
التحقق من �صحة النطاق يف �إك�سل Range Validation Check in Excel
لتطبيق التحقق من �صحة النطاق يف �إك�سل: > انتقل �إىل ورقة "الطق�س واألأحداث يف اململكة العربية ال�سعودية" يف �إك�سل. > حدد اخللية 2 .C3 >م��ن عالم��ة التبوي��ب بيان��ات (،)Dataويف جمموع��ة �أدوات البيان��ات ( ،)Data toolsا�ضغ��ط عل��ى ناف��ذة التحق��ق م��ن �صحة البيان��ات (3 .)Data Validation >م��ن ناف��ذة حتق��ق م��ن �صح��ة البيان��ات ( ،)Data Validationاخ�رتر عالم��ة التبوي��ب �إع��دادات (4 .)Settings > من مربــع ال�سماح ( ،)Allowاخرت خم�ص�ص (5 .)Custom >يف مربع ال�صيغة ،اكتب (6 .=AND(C3>20;C3 �ألغ حتديد خيار جتاهل الفراغ ( 7 ،)Ignore blankثم ا�ضغط على موافق (8 . )OK >ا�س��تخدم �أداة التعبئ��ة التلقائي��ة ( )AutoFillلتطبي��ق التحق��ق م��ن ال�صح��ة عل��ى اخلالي��ا م��ن � C4إىل 9 .C17 1
ا�س��تمر يف العم��ل عل��ى العم��ود الثال��ث ،عم��ود "درج��ة احل��رارة العظم��ى (درجة مئوية)" .قبل �إدخ��ال قي��م درج��ات احل��رارة حتق��ق م��ن �صح��ة النط��اق؛ حت��ى تتمك��ن م��ن �إدخ��ال قي��م درج��ات احل��رارة بحي��ث ت�رتراوح م��ن � 20إىل 45درج��ة مئوي��ة فقط. تعني ال�صيغة
"("=AND(C3>20;C3م��ن ناف��ذة حتق��ق م��ن �صح��ة البيان��ات (،)Data Validation اخ�رتر عالم��ة التبوي��ب ر�س��الة �إدخ��ال (.)Input Message > يف مربــع العنوان )Title:( :اكتب "إرشادات إدخال البيانات"3 . >يف مربــ��ع ر�س��الة �إدخ��ال )Input message:( :اكت��ب "يج��ب �أن تك��ون بيان��ات درج��ة احل��رارة �ضم��ن نط��اق حم��دد م��ن القي��م4 ". 1
2
3 4
ال�شكل :2.35تعيني ر�سالة �إدخال غري �صالح
1
2
لتعيني ر�سالة تنبيه �إىل اخلط�أ: >م��ن ناف��ذة حتق��ق م��ن �صح��ة البيان��ات (،)Data Validation اخرت عالمة التبويب تنبيه �إىل اخلط�أ (2 .)Error Alert > من مربع النمط ( )Styleاخرت �إيقاف (3 .)Stop >يف مربع العنوان )Title:( :اكتب "املدخالت غري �صاحلة"4 . >يف مرب��ع ر�س��الة خط ��أ ( )Error messageاكت��ب "يج��ب �أن ت�رتراوح قيم��ة درج��ة احل��رارة ب�نين 20و 45درج��ة مئوي��ة"5 . > ا�ضغط موافق (6 .)OK 1
4
3
5
6 ال�شكل :2.36تعيني ر�سالة تنبيه �إىل اخلط�أ
78
بعد النتهاء من اإجراء التحقق من �سحة النطاق ،ميكنك البدء يف اإدخال بيانات قيم درجات احلرارة العظمى (درجة مئوية). ي�سمح لك يف كل خلية من C3اإىل C17اإدخال قيمة درجة حرارة ترتاوح بني 20اإىل 45درجة مئوية. �س��تظهر ر�س��الة الإدخ��ال دائ ًم��ا داخ��ل اخلالي��ا ،واإذا كتب��ت ع��ن طري��ق اخلط�اأ قيم��ة اأق��ل م��ن 20درج��ة مئوي��ة اأو اأك��رب م��ن 45درج��ة مئوية ف�س��تظهر ر�س��الة اخلطاأ التي عينتها اأثناء التحقق من ال�سحة على ال�سا�سة.
عندما ت�سع ر�سالة في عالمة تب�يب "ر�سالة اإدخال" �ستظهر دائ ًما اأثناء كتابة قيم درجة الحرارة العظمى (درجة مئ�ية) في الخاليا من C3اإلى .C17
ال�سكل :2.38ر�سالة الإدخال ور�سالة اخلطاأ للتحقق من �سحة النطاق
اإذا كتبت عن طريق الخطاأ قيمة في عم�د درجة الحرارة العظمى (درجة مئ�ية) ال تفي بالمعايير التي حددتها بالفعل ،ف�سيعر�س اإك�سل ر�سالة الخطاأ التي عينتها اأثناء التحقق من ال�سحة في عالمة تب�يب "تنبيه اإلى الخطاأ".
79
�سكل :2.39جدول التحقق من �سحة البيانات
80
بعد ا�ستكمال اإدخال جميع بيانات درجات احلرارة يف اخلاليا C3اإىل ،C17 �سيظهر جدول "الطق�س واالأحداث يف اململكة العربية ال�سعودية" على هذا النحو يف ورقة االإك�سل.
التحقق من �سحة ال�سيغة يف اإك�سل
Format Validation Check in Excel
ا�س��تمر يف العمل على العمود الرابع ،عمود "متو�س��ط هطول الأمطار (املليمرت)" .قبل اإدخال قيم هطول الأمطار ،حتقق من �سحة ال�سيغة؛ حتى تتمكن لي�ص فقط من اإدخال القيم ال�سحيحة ،ولكن اأي�سا الك�سور الع�سرية .يتطلب هذا الإجراء تعيني احلد الأدنى والأق�سى ،لذلك �ستعني احلد الأدنى ملتو�سط قيم��ة هط��ول الأمط��ار ي�س��اوي 0مم واحل��د الأق�س��ى ي�س��اوي 30مم. لبدء عملية التحقق من �سحة البيانات يف اإك�سل: > انتقل اإىل ورقة "الطق�ص والأحداث يف اململكة العربية ال�سعودية" يف اإك�سل. > حدد اخلاليا D3اإىل 2 .D17 > ثم اخرت عالمة التبويب بيانات (3 .)Data > م��ن جمموع��ة اأدوات البيان��ات ( 4 ،)Data toolsا�سغ��ط عل��ى ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (5 .)Data Validation > �ستظهر نافذة حتقق من �سحة البيانات (6 .)Data Validation 1
3 4
5
6
2
1 ال�سكل :2.40بدء التحقق من �سحة البيانات يف اإك�سل
81
1
2
لتطبيق التحقق من �سحة ال�سيغة يف اإك�سل: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب اإع��دادات (2 .)Settings > من مرب��ع ال�سماح ( ،)Allowاخرت عدد ع�سري (3 .)Decimal > من مرب��ع البيانات ( )Dataاخرت بن (4 .)Between > يف مرب� ��ع احل��د االأدن��ى ( ،)Minimumاكت��ب ،0ويف مرب��ع احل��د االأق�س��ى ( :)Maximumاكت��ب 5 .30 > األغ حتديد خيار جتاهل الفراغ (6 .)Ignore Blank 1
3
6 4 5
ال�سكل :2.41تطبيق التحقق من �سحة ال�سيغة يف اإك�سل
لتعين ر�سالة اإدخال غري �سالح: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (1 ،)Data Validation اخ��رت عالم��ة التبوي��ب ر�س��الة اإدخ��ال (2 .)Input Message > يف مرب��ع العن�ان ،)Title:( :اكتب "اإر�سادات اإدخال البيانات"3 . > يف مرب� ��ع ر�س��الة اإدخ��ال ( ،)Input Messageاكت��ب "يج��ب اأن تك��ون قيم��ة هطول الأمطار رقم ع�س��ري"4 .
1
2
3 4
ال�سكل :2.42تعيني ر�سالة اإدخال غري �سالح
لتعين ر�سالة تنبيه اإىل اخلطاأ: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (1 ،)Data Validation اخ��رت عالم��ة التبوي��ب تنبي��ه اإىل اخلط �اأ (2 .)Error Alert > من مربع النمط ( )Styleاخرت اإيقاف (3 .)Stop > يف مربع العن�ان )Title:( :اكتب "املدخالت غري �ساحلة" 4 . > يف مرب��ع ر�س��الة خط �اأ ( ،)Error message:اكت��ب "قي��م هط��ول الأمطار لي�ست يف �سكل ع�سري"5 . > ا�سغط م�افق (6 .)OK
1
2
4
3
5
6 ال�سكل :2.43تعيني ر�سالة تنبيه اإىل اخلطاأ
82
عن��د النته��اء م��ن خط��وة التحق��ق م��ن �سح��ة ال�سيغ��ة ،ميكن��ك الب��دء يف اإدخ��ال بيان��ات هط��ول الأمط��ار .ميك��ن اأن تدخ��ل قيم��ة ل��كل خلي��ة م��ن D3اإىل D17
و ُي�س��مح لك باإدخال قيمة هطول الأمطار يف �س��كل ع�س��ري بقيم ترتاوح بني 0اإىل 30مم. �س��تظهر ر�س��الة الإدخ��ال با�س��تمرار وح��ال اإدخ��ال قيم��ة ع��ن طري��ق اخلط�اأ اأق��ل م��ن 0مم اأو اأك��رب من � 30س��تظهر على ال�سا�س��ة مبا�س��ر ًة ر�س��الة اخلطاأ التي قمت بتعيينها �ساب ًقا. عندما ت�سع ر�سالة في عالمة تب�يب "ر�سالة اإدخال" �ستظهر دائ ًما اأثناء كتابة مت��سط قيم هط�ل االأمطار (مم) في الخاليا من D3اإلى .D17
ال�سكل :2.44ر�سالة اإدخال وتنبيه اإىل اخلطاأ للتحقق من �سحة النطاق
اإذا كتبت عن طريق الخطاأ قيمة في عم�د مت��سط هط�ل االأمطار (المليمتر) ال تفي بالمعايير التي حددتها بالفعل ،ف�سيعر�س اإك�سل ر�سالة الخطاأ التي عينتها اأثناء التحقق من ال�سحة.
83
�سكل :2.45جدول التحقق من �سحة البيانات
84
بعد ا�ستكمال اإدخال جميع بيانات متو�سط هطول االأمطار يف اخلاليا D3 اإىل � ،D17سيظهر جدول "الطق�س واالأحداث يف اململكة العربية ال�سعودية" على هذا النحو يف ورقة االإك�سل.
التحقق من �سحة النوع يف اإك�سل
Type Validation Check in Excel
ا�س��تمر يف العم��ل عل��ى العم��ود اخلام���ص ،عم��ود "ع��دد الأح��داث" .قب��ل اإدخ��ال ع��دد الأح��داث ل��كل مدين��ة ،حتق��ق م��ن �سحة الن��وع؛ حتى تتجن��ب اإدخال قيم �س��البة .ت�س��تدعي ه��ذه اخلط��وة تعي��ني قيم��ة احل��د الأدن��ى ،لذل��ك �س��تعني قيم��ة احل��د الأدن��ى ت�س��اوي 1حت��ى ل تك��ون قي��م احلدث م�س��اوية لل�سف��ر وكذلك ل حتوي قي ًما �س��البة. لبدء عملية التحقق من �سحة البيانات يف اإك�سل: > انتقل اإىل ورقة "الطق�ص والأحداث يف اململكة العربية ال�سعودية" يف اإك�سل. > حدد اخلاليا من E3اإىل 2 .E17 > ثم اخرت عالمة تبويب بيانات (3 .)Data > م��ن جمموع��ة اأدوات البيان��ات ( 4 ،)Data toolsا�سغ��ط عل��ى ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (5 .)Data Validation > �ستظهر نافذة حتقق من �سحة البيانات (6 .)Data Validation 1
3 4
5
6
2
1 ال�سكل :2.46بدء التحقق من �سحة البيانات يف اإك�سل
85
1 2
لبدء عملية التحقق من �سحة البيانات يف اإك�سل: > م��ن ناف��ذة حتق��ق م��ن �سحة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب اإع��دادات (2 .)Settings > م��ن مرب� ��ع ال�س��ماح ( )Allowاخ��رت ع��دد �سحي��ح (3 .)Whole Number > م��ن مرب� ��ع البيان��ات ( )Dataاخ��رت اأك��ر م��ن اأو ت�س��اوي (4 .)greater than or equal to > يف مرب��ع احلد االأدنى )Minimum:( :اكتب 5 1 > األغ حتديد خيار جتاهل الفراغ (6 .)Ignore blank 1
6
3 4
5
ال�سكل :2.47تطبيق التحقق من �سحة النوع يف اإك�سل
1
2
لتعين ر�سالة اإدخال غري �سالح: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب ر�س��الة اإدخ��ال (.)Input Message > يف مرب��ع العن�ان )Title:( :اكتب "اإر�سادات اإدخال البيانات"3 . > يف مرب� ��ع ر�س��الة اإدخ��ال ( ،)Input Messageاكت��ب اأدخ��ل رق ًم��ا �سحيحا غري �س��الب4 . ً 1
2
3 4
ال�سكل :2.48تعيني ر�سالة اإدخال غري �سالح
1
2
لتعين ر�سالة تنبيه اإىل اخلطاأ: > م��ن ناف��ذة حتق��ق م��ن �سح��ة البيان��ات (،)Data Validation اخ��رت عالم��ة التبوي��ب تنبي��ه اإىل اخلط �اأ (2 .)Error Alert > من مربع النمط ( ،)Styleاخرت اإيقاف (3 .)Stop > يف مربع العن�ان )Title:( :اكتب "املدخالت غري �ساحلة"4 . > يف مرب��ع ر�س��الة خط �اأ ( )Error messageاكت��ب "ل ميك��ن اأن يك��ون ع��دد الأحداث �س��ال ًبا"5 . > ا�سغط م�افق (6 .)OK 1
4
3
5
6 ال�سكل :2.49تعيني ر�سالة تنبيه اإىل اخلطاأ
86
بع��د النته��اء م��ن اإج��راء التحق��ق م��ن �سح��ة الن��وع ،اأدخ��ل بيان��ات الأح��داث كم��ا ه��و مو�س��ح باجل��دول رق��م .2.8ميكن اأن تدخ��ل قيمة لكل خلي��ة من E3اإىل E17و ُي�س��مح لك باإدخال رقم ي�س��اوي اأو اأكرب من � .1س��يتم عر�ص ر�س��الة الإدخال با�س��تمرار واإذا اأدخلت عن طريق اخلطاأ قيمة اأقل من ،1ف�س��تظهر على ال�سا�سة ر�سالة اخلطاأ التي قمت بتعيينها �ساب ًقا.
�ستظهر ر�سالة الخطاأ دائما اأثناء كتابة عدد االأحداث.
ال�سكل :2.50ر�سالة اإدخال وتنبيه اإىل اخلطاأ للتحقق من �سحة النوع
اإذا كتبت قيمة عن طريق الخطاأ في عم�د االأحداث ال تفي بالمعايير التي حددتها بالفعل ،ف�سيعر�س اإك�سل ر�سالة الخطاأ التي عينتها اأثناء التحقق من ال�سحة.
87
�سكل :2.51جدول التحقق من �سحة البيانات
88
بعد ا�ستكمال ادخال االأحداث يف اخلاليا من E3اإىل ،E17 �سيظهر جدول "الطق�س واالأحداث يف اململكة العربية ال�سعودية" على هذا النحو يف ورقة االإك�سل.
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1ي�س��ري التحق��ق م��ن �سح��ة البيان��ات اإىل الإج��راء ال��ذي يح��ذف تلقائ ًي��ا اأي بيان��ات اأولي��ة ل تفي مبعايري معينة. .2ل يوجد �سوى خم�سة اأنواع للتحقق من �سحة البيانات. .3ي�ساعد التحقق من التواجد على تقليل الأخطاء با�ستخدام قائمة حمدودة من القيم املحددة م�سب ًقا. .4يهدف التحقق من البحث اإىل التاأكد من اأن الرموز واحلروف تدخل بنطاق طول حمدد. ُ .5ي�ستخدم فح�ص النطاق للتاأكد من اأن الأرقام التي تُدخل تقع �سمن نطاق معني. ُ .6ي�ستخدم التحقق من ال�سيغة للتاأكد من اأن البيانات تاأتي ب�سيغة حمددة م�سب ًقا. .7ي�ساعد التحقق من النوع يف تقليل اأخطاء اللغة. .8يتم ا�ستخدام رقم التحقق اإذا اأردت التاأكد من اإدخال جمموعة من الأرقام ب�سكل �سحيح. .9يعترب مايكرو�سوفت اإك�سل الأداة الوحيدة التي ميكن ا�ستخدامها للتحقق من �سحة البيانات. .10ميك��ن اإج��راء التحق��ق م��ن �سح��ة البيان��ات بع��د اإدخ��ال القي��م يف برنام��ج التحق��ق م��ن �سح��ة البيانات. 89
2ا�سرح بايجاز املق�س�د بعملية التحقق من �سحة البيانات. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
�ِ 3سف باخت�سار اخلط�ات التي يجب اتباعها يف اإك�سل الإكمال عملية التحقق من �سحة البيانات. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
90
4اأن�س��ئ دلي��ل عناوي��ن ملعل�م��ات اأ�سدقائ��ك يت�سم��ن احلق���ل التالي��ة :اال�س��م ،والهات��ف ،وعن���ان املن��زل ،وعن���ان الريد االإلكرتوين ،وتاريخ امليالد ،واله�اية .اكتب ن�ع التحقق من �سحة البيانات الذي يجب اإجراوؤه على كل حقل من احلق�ل ال�س��ابقة. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
5ق��ارن م��ا يل��ي( :اأ) فح���س الط���ل مقاب��ل فح���س النط��اق( ،ب) فح���س ال�سيغ��ة مقاب��ل فح���س الن���ع .اأع� ِ�ط اأمثل��ة عل��ى ا�س��تخدام كل ن���ع م��ن اأن���اع التحق��ق ال�س��ابقة. ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________ ________________________________________________________________________________________
91
امل�سروع
92
1
افرت���ص اأن��ك تعم��ل كباح��ث يف القط��اع ال�سح��ي وتري��د اإع��داد تقري��ر ح��ول م�س��كلة مر�ص ال�س��كري يف بلدك ،ا�س��رح اخلطوات التي متكنك من التحقق م��ن �سح��ة البيان��ات الت��ي ق��د مت جمعه��ا.
2
على وجه التحديد يتعني عليك الإجابة على اأ�سئلة مثل الأ�سئلة التالية: ما نوع الأعمدة التي �ستقوم باإن�سائها؟ ا ٍأي من عمليات التحقق ال�ستة �سيتم اإجراوؤها يف كل عمود؟ وملاذا؟
3
اأن�س��ئ ً مو�سح��ا خط��وات عر�س��ا تقدمي ًي��ا يف باوربوين��ت (،)PowerPoint ً اإج��راء التحق��ق م��ن �سحة البيانات التي قمت بها؟
ماذا تعلمت
ما املق�سود بجمع البيانات. التمييز بني اأنواع البيانات املختلفة. كيفية ترميز البيانات. كيفية التحقق من �سحة البيانات. كيفية التحقق من جودة املعلومات. كيفية التمييز بني م�سادر البيانات الرئي�سة وم�سادر البيانات الثانوية.
الم�سطلحات الرئي�سة ج�دة المعل�مات رقم الكتاب المعياري الدولي
Information Quality Isbn
الدقة المالءمة
Accuracy Appropriateness
االأذونات القان�نية
Legal Permissions
البيانات ال�س�تية
Audio Data
التحقق من الط�ل
Length Check
الرم�ز ال�سريطية
Barcode
م�ست�ى التفا�سيل
Level Of Detail
التحقق من الرقم
Check Digit
التحقق من البحث
Lookup Check
الكفاية
Completeness
Open Data Platforms
البيانات
Data
من�سات البيانات المفت�حة التحقق من الت�اجد رمز اال�ستجابة ال�سريعة التحقق من النطاق التحقق من الن�ع
Presence Check QR Code Range Check Type Check
بيانات متغيرة
Variable Data
بيانات الفيدي�
Video Data
ترميز البيانات
Data Coding
اأن�اع البيانات
Data Types
التحقق من �سحة البيانات بيانات ثابتة التحقق من ال�سيغة البيانات المرئية
Data Validation Fixed Data Format Check Graphical Data
93
.3التحليل اال�ستك�سايف للبيانات يف الوح��دات ال�س��ابقة ،تعل��م الطال��ب مفه��وم البيان��ات واأمناطه��ا املختلفة وكيفية جمعها ب�سكل �سحيح .و يف هذه الوحدة� ،سيتعلم الطالب طريقة فح�س وحتليل البيانات لفهمها ب�سكل اأف�سل.
اأهداف التعلم بنهاية هذه الوحدة �سيكون الطالب قاد ًرا على اأن: ي�سنّف اأمناط حتليل البيانات. يعرف مفهوم التحليل اال�ستك�سايف للبيانات. ّ ي�سنّف اأمناط التحليل اال�ستك�سايف للبيانات. ي�سرح مراحل عملية التحليل اال�ستك�سايف للبيانات. يعرف مفهوم املكتبات الربجمية. ّ يط ّور برنامج لتحليل البيانات با�ستخدام مكتبات الربجمة. ي�ستخدم تقنيات اإعداد البيانات وتنظيفها يف جمموعة بيانات. ي�سرح اأهمية ت�سوير البيانات. مي ّيز االأمناط املختلفة من الر�سوم البيانية التي ميكن اإن�ساوؤها با�ستخدام مكتبات البايثون.
94
الدر�س االأول
حتليل البيانات مفهوم حتليل البيانات
What is Data Analysis
اأن��ت حتل��ل كل �س��يء يف حيات��ك اليومي��ة ،فعل��ى �س��بيل املث��ال ،عن��د التفك��ري فيم��ا ح��دث يف امل��رة الأخ��رية التي فعلت فيها �سي ًئا وماذا �سيحدث اإذا اتخذت هذا القرار مرة اأخرى .وما هذا اإ ّل حتليل ملا�سيك اأو مل�ستقبلك واتخ��اذ قرارات��ك بنا ًءا على ذلك التحليل. ُيع� َّرف حتلي��ل البيان��ات باأن��ه عملي��ة فح���ص البيان��ات وتنظيفه��ا وحتويله��ا ومنذجته��ا ل�س��تخال�ص املعلوم��ات املفيدة ،واإثراء ال�ستنتاجات ودعم عملية اتخاذ القرارات.
اأمناط حتليل البيانات
حتليل البيانات: فح���ص منهج��ي للبيان��ات عن طريق العينات والقيا�ص والت�سوير.
Types of Data Analysis
بنا ًءا على رغبتك يف حتليل البيانات وامل�سكلة املحددة التي حتاول حلها ،فقد تقوم باإجراء اأنواع خمتلفة من التحليالت: > التحليل الت�جيهي (.)Prescriptive Analysis > التحليل التنب�ؤي (.)Predictive Analysis التحليل الت�سخي�سي (.)Diagnostic Analysis التحليل ال��سفي (.)Descriptive Analysis
يهت��م التحلي��ل الو�سف��ي مب��ا ح��دث يف املا�س��ي ،و ُيع��رف غال ًب��ا باإ�س��م التحلي��الت الو�سفي��ة اأو الإح�س��اءات الو�سفي��ة وه��و و�س��ف اأو تلخي���ص جمموعة من البيانات با�ستخدام التقنيات الإح�سائية .وت ُربز اأهمية التحليل الو�سفي كاأحد اأهم اأمناط حتليل البيانات ،نظرا لقدرته على حتلي��ل البيان��ات الت��ي مل يت��م حتليله��ا بع��د .اإل اأن التحلي��الت الو�سفي��ة ل تُقدّم تنبوؤات حول امل�س��تقبل.
التحليل الت�سخي�سي
القيمة
التحليل الو�سفي
Descriptive Analysis
الت�جيهي
التنب�ؤي
الت�سخي�سي
Diagnostic Analysis
يهت��م حتلي��ل البيان��ات الت�س��خي�سي باأ�س��باب ح��دوث �س��يء م��ا .ويق��وم التحلي��ل الت�س��خي�سي عل��ى التحلي��ل الو�سف��ي ،وي�س��عى املخت�س��ون من خالل��ه اإىل فه��م �س��بب التوجه��ات والأمن��اط التي مت��ت مالحظتها.
ال��سفي
م�ستوى التعقيد ال�سكل :3.1اأمناط حتليل البيانات
95
التحليل التنبوؤي
Predictive Analysis
يهت��م حتلي��ل البيان��ات التنب�وؤي مبحاول��ة التنب�وؤ بالنتائ��ج امل�س��تقبلية بن��ا ًءا عل��ى التاهات املكت�س��فة �س��اب ًقا والبيانات التاريخية ،با�ستخدام تقنيات النمذجة والإح�ساءات .وي�ستخدم التحليل التنبوؤي يف العديد من احلالت املختلفة ،مثل التنبوؤ بالطق�ص و�سيا�سات التاأمني وغري ذلك.
التحليل التوجيهي
التحليل التنب�ؤي: ا�س��تخدام بيانات �س��ابقة مع مناذج ريا�سي��ة للتنب�وؤ بالنتائج امل�س��تقبلية اأو الأحداث غري املعروفة.
Prescriptive Analysis
وتتمث��ل املرحل��ة الأخ��رية م��ن حتلي��ل البيان��ات يف التحلي��ل التوجيهي الذي يهتم مبحاولة اإيجاد م�س��ار العمل الأمث��ل .بن��ا ًءا عل��ى اكت�س��افات مراح��ل التحلي��ل ال�س��ابقة ،ف�اإن اله��دف م��ن التحليالت التوجيهي��ة هو تقدمي تو�سي��ات للخط��وات امل�س��تقبلية .وه��ذا الن��وع م��ن التحلي��ل مفي��د ب�س��كل خا���ص يف القط��اع ال�سح��ي ،وذل��ك للحاج��ة اإىل تو�سي��ات طبي��ة اآمن��ة. التحليالت التنبوؤية والتوجيهية اأكر تعقيدً ا من التحليالت الو�سفية والت�س��خي�سية ،لكنه��ا توف��ر املزي��د من القيم��ة امل�ساف��ة والفهم االأعمق لكل م�سروع.
عملية حتليل البيانات
Data Analysis Process
تت�سم��ن عملي��ة حتلي��ل البيان��ات جم��ع املعلوم��ات ومعاجلتها وفح�ص البيانات .وبنا ًءا على نتائج املعاجلة ،ميكنك اتخاذ القرارات اأو ا�س��تخال�ص النتائج. خطوات عملية حتليل البيانات هي كالتي: اإعداد البيانات وتنظيفها :من خالل هذه العملية تزيل امل�سافات البي�ساء الزائدة وال�سجالت املكررة واأخطاء البيانات الأ�سا�سية .فتنظيف البيانات اإلزامي قبل اإر�سال املعلومات لتحليلها. التحلي��ل اال�ستك�س��ايف للبيان��ات :ويف ه��ذه اخلط��وة تب��داأ يف ا�س��تخدام برام��ج حتلي��ل البيان��ات واأدوات اأخ��رى مل�س��اعدتك عل��ى تف�س��ري البيان��ات وفهمه��ا والتو�س��ل اإىل ا�س��تنتاجات. ت�س�ير البيانات :ويف هذه اخلطوة ت�ستطيع اأن تقوم بت�سوير البيانات من خالل الر�سم البياين ملجموعة من املعلومات اأو البيانات .و ُي�سهل ت�سوي��ر البيان��ات عملي��ة فهمه��ا وحتليله��ا .فبا�س��تخدام العنا�س��ر املرئي��ة مثل املخططات والر�س��وم البيانية واخلرائ��طُ ،ي�سبح ت�سور البيانات اأكرث �سهولة وفه ًما وقابلية لال�ستخدام.
1
تعريف امل�سكلة و�سياغتها
2
جمع البيانات
3
اإعداد البيانات وتنظيفها
4
التحليل اال�ستك�سايف للبيانات عملية حتليل البيانات
ال�سكل :3.2دورة حياة علم البيانات
96
5
ت�سوير البيانات
تعريف مفهوم التحليل اال�ستك�سايف للبيانات What is Exploratory Data Analysis
ب�س��كل ع��ام ،يج��در ب��ك حماول��ة فه��م البيان��ات وجم��ع اأك��رب ق��در ممك��ن م��ن املعلوم��ات قب��ل النتق��ال اإىل مهم��ة النمذج��ة .التحلي��ل ال�ستك�س��ايف للبيان��ات ه��و و�س��يلة لفه��م البيان��ات واإج��راء الفحو�س��ات الأولي��ة وتلخي���ص خ�سائ�سه��ا الرئي�س��ية .وتكم��ن الأه��داف الرئي�س��ية للتحلي��ل ال�ستك�س��ايف للبيان��ات يف اكت�س��اف التاهات والأمناط وامليزات اجلديدة يف البيانات .ميكنك ا ً أي�سا اكت�س��اف احلالت ال�س��اذة يف جمموعة البيان��ات ،واختب��ار فر�سيت��ك الأولي��ة واحل�س��ول عل��ى فه��م اأف�س��ل ملتغ��ريات جمموع��ة البيان��ات والعالق��ات بينه��ا .ميك��ن اأن ي�س��اعدك التحلي��ل ال�ستك�س��ايف للبيان��ات ا ً أي�س��ا يف حتدي��د الأخط��اء الوا�سح��ة والتاأكد من اأن نتائ��ج مهم��ة معين��ة �ساحل��ة وقابل��ة للتطبي��ق عل��ى اأي ه��دف مرغ��وب .ونظ� ًرا لأن ا�س��تخال�ص املعلوم��ات م��ن خ��الل النظ��ر اإىل الأرق��ام ميك��ن اأن يك��ون عملي��ة ممل��ة ،فق��د مت تطوي��ر التحلي��ل ال�ستك�س��ايف للبيان��ات كم�ساعدة للقيام بهذه العملية ،و يجري حتقيق كل ذلك مب�ساعدة املوجز الإح�سائي والتمثيالت الر�سومية وط��رق ت�سوي��ر البيان��ات .ومبج��رد اكتم��ال التحلي��ل ال�ستك�س��ايف للبيانات وا�س��تخال�ص معلومات كافية من البيانات ،فيمكنك ا�ستخدام هذه اخل�سائ�ص لإجراء اأ�ساليب حتليل اأكرث تعقيدً ا مثل تع ّلم الآلة.
حتليل البيانات اال�ستك�سايف: املنه��ج املتب��ع يف حتلي��ل جمموع��ة من البيانات لتلخي�ص خ�سائ�سها الرئي�س��ة ،وغالب��ا تت��م با�س��تخدام الط��رق الب�سرية.
اأمناط التحليل اال�ستك�سايف للبيانات
Types of Exploratory Data Analysis
ُي�سن��ف التحلي��ل ال�ستك�س��ايف للبيان��ات بطريقت��ني :ا ًأول ،طريق��ة ر�س��ومية اأو غ��ري ر�س��ومية ،وثان ًي��ا ،طريق��ة اأحادي��ة اأو متع��ددة املتغ��ريات (ع��ادًة م��ا يك��ون املتغ��ري ثنائ ًيا) .يف حالة اأح��ادي املتغري فاإنه يتم حتليل تاأثري متغ��ري م�س��تقل واح��د فق��ط ،بينم��ا م��ع متع��دد املتغ��ريات يتم حتليل اأكرث من متغري م�س��تقل يف اآن واحد ،ويف امل�س��اريع الكبرية ُيعد التحليل متعدد املتغريات الأكرث �س��يوعا.
التحليل اال�ستك�سايف للبيانات
ر�سومي
اأحادي املتغري
غري ر�سومي
متعدد املتغريات
اأحادي املتغري
متعدد املتغريات
ال�سكل :3.3اأمناط التحليل ال�ستك�سايف للبيانات
97
التحليل غري الر�سومي
Non-Graphical Analysis
التحليل غري الر�سومي اأحادي املتغري
Univariate Non-Graphical Analysis
اأح��د الأمثل��ة عل��ى التحلي��ل غ��ري الر�س��ومي اأح��ادي املتغ��ري هو تاأثري العمر على الإ�سابة ببع���ص اأنواع الأمرا�ص مثل مر�ص الزهامير .هذا التحليل اأحادي املتغري لأنه يقي�ص تاأثري العمر فقط ،وغري ر�سومي لأنه ل ي�ستخدم تقنيات الت�سوير البياين.
التحليل غري الر�سومي متعدد املتغريات
Multivariate Non-Graphical Analysis
اإذا اأخ��ذت يف العتب��ار م��ن املث��ال ال�س��ابق اآث��ار النظ��ام الغذائ��ي والتماري��ن الذهني��ة والوراث��ة ا ً أي�س��ا ،ف�س��يكون ه��ذا التحلي��ل حتلي� ً�ال غ��ري ر�س��ومي متع��دد املتغريات.
التحليل الر�سومي
Graphical Analysis
التحليل الر�سومي اأحادي املتغري Univariate Graphical Analysis
يف ال�س��كل 3.4مث��ال عل��ى التحلي��ل الر�س��ومي اأح��ادي املتغ��ري. ال�س��كل ُيظه��ر خمط��ط �س��ريطي ( ،)Bar Chartوميث��ل كل عم��ود ن�س��بة ال�س��كر الت��ي حتتويه��ا خم���ص اأنواع من احلل��وى املختلفة ،وهذا التحليل الر�سومي اأحادي املتغري لأنه يحلل متغري واحد فقط ،ويتم عر�سه بطريقة ر�س��ومية.
التحليل الر�سومي متعدد املتغريات
ال�سكل :3.4التحليل الر�سومي اأحادي املتغري
Multivariate Graphical Analysis
يف ال�س��كل 3.5مث��ال عل��ى التحلي��ل الر�س��ومي متع��دد املتغ��ريات. ال�س��كل ُيظه��ر خمط��ط نقط��ي ( )Scatter Plotيع� ّ�رب ع��ن اأن��واع احلل��وى املختلف��ة بحي��ث ميث��ل املح��ور الأفق��ي (س) حمت��وى ال�س��كر يف احللوى بينما املحور الراأ�سي (ص) �سعر احللوى ،ويتم ترميزها بالألوان بنا ًء على ما اإذا كانت احللوى حتتوي على ال�سوكولتة اأم ل. �س��تتعرف عل��ى املخط��ط النقط��ي واأن��واع اأخ��رى م��ن اأ�س��كال ت�سوي��ر البيانات لح ًقا يف هذه الوحدة ،وهذا املثال على التحليل الر�سومي متع��دد املتغ��ريات مت في��ه حتليل ثالث متغريات م ًعا ،وت�سوير عالقة الرتباط بينهم ب�س��كل بياين. اأدوات حتليل البيانات Data Analysis Tools
ال�سكل :3.5التحليل الر�سومي متعدد املتغريات
هناك العديد من الأدوات التي ميكنك ا�ستخدامها ملعاجلة العالقات والرتباطات بني جمموعات البيانات ومعاجلتها وحتليلها ،وت�ساعدك هذه الأدوات ا ً أي�س��ا يف حتدي��د الأمن��اط والتوجه��ات للتف�س��ري .لختي��ار اأداة حتلي��ل البيان��ات ،يجب عليك اأو ًل فه��م احتياجاتك .الأداة التحليلية الأكرث وا�ستخداما على نطاق وا�سع يف جميع ال�سناعات تقري ًبا هي اإك�سل .بالإ�سافة اإىل برامج جداول البيانات ،ميكن اإجراء حتليل البيانات �سيوعا ً ً بلغ��ات الربجم��ة املتخ�س�س��ة والبيئ��ات الربجمي��ة ا ً أي�س��ا .البيئ��ات الأك��رث �س��عبية ه��ي :مفك��رة ج�بي��رت ( ،)Jupyter Notebookو اآر �س��ت�دي� ( ،)RStudioو مات��الب (.)MATLAB يف هذه الوحدة� ،ست�ستخدم مفكرة جوبيرت كاأداة لتحليل البيانات. 98
حتليل البيانات با�ستخدام البايثون
Data Analysis with Python
�تخداما مل�س��روعات علم البيانات من قبل كل من علماء كما تعلمت �س��اب ًقا ،ميكن ا�س��تخدام البايثون يف حتليل البيانات ،وهي واحدة من اللغات الأكرث ا�س� ً البيانات ومطوري الربامج .ميكن ا�ستخدامه للتنبوؤ بالنتائج ،واأمتتة الوظائف ،وتب�سيط العمليات ،ومتكني ذكاء الأعمال .لإجراء حتليل البيانات با�ستخدام لغة البايثون ،ميكنك ال�ستفادة من مكتبات البايثون.
املكتبات والوحدات النمطية التابعة لبايثون
Python Libraries/Modules
ع��ادة م��ا تك��ون املكتب��ة عب��ارة ع��ن جمموع��ة م��ن الكت��ب اأو موق��ع يت��م في��ه الحتف��اظ بالعديد م��ن الكتب ل�س��تخدامها لح ًق��ا ،ولكن يف الربجمة ،املكتبة عبارة عن جمموعة من املقاطع الربجمية املكتوبة م�س��ب ًقا والربامج الفرعية التي ميكن اأن ي�س��تخدمها الربنامج، و�س ّمم��ت مل�س��اعدة كل م��ن املربم��ج واملح���ل الرجم��ي ( )Compilerعل��ى اإن�س��اء برنام��ج .ول�س��تخدام املكتب��ة ،علي��ك ت�سمينه��ا يف ُ مقطعك الربجمي ،ول�س��تخدامها يف البايثون ،عليك اإ�سافة كلمة ا�س��ترياد ( )Importوا�س��م املكتبة. املكتب��ة يف لغ��ات الربجم��ة مث��ل البايث��ون ه��ي جمموع��ة م��ن املقاط��ع الربجمي��ة املجه��زة م�س��ب ًقا والت��ي ميك��ن ا�س��تخدامها لح ًق��ا يف الربنام��ج لعملي��ات حم��ددة جي��دً ا .فباملقارن��ة م��ع لغ��ات الربجم��ة الأخ��رى ،ل تتعل��ق املكتب��ة ب �اأي �س��ياق حم��دد يف البايث��ون، وق��د حتت��وي املكتب��ة ا ً أي�س��ا عل��ى الت�ثي��ق ( )Documentationوبيان��ات التك�ي��ن ( )Configuration Dataوق�ال��ب الر�س��ائل ( )Message Templatesوالفئات ( )Classesوالقيم ( )Valuesوغريها. أ�سا�س��ا جمموع��ة م��ن الوح��دات النمطي��ة اأو ح��زم يف البايث��ون ،ت�س��ف املكتب��ة ب�س��كل ع��ام جمموع��ة م��ن الوح��دات النمطي��ة ،و حت��وي ا ً ُب�س��ط وتُ�س� ّرع برجمة البايثون للمطورين لأنهم غري من املقاطع الربجمية القابلة لإعادة ال�س��تخدام يف العديد من الربامج ،فهي ت ّ م�سطرين لإعادة كتابة نف�ص املقطع الربجمي لربامج خمتلفة .يعتمد تع ّلم الآلة وعلوم البيانات وت�سوير البيانات واملجالت الأخرى ب�سكل كبري على مكتبات البايثون. اجلدول :3.1مزايا وعيوب ا�ستخدام مكتبات املقاطع الربجمية االإيجابيات
+
ال�سلبيات
-
�سرعة االإعداد واال�ستخدام يف مقطعك الرجمي.
اإذا كنت بحاجة اإىل تغيريات ،فمن ال�سعب جدًا اأو امل�ستحيل تنفيذها.
عاد ًة خالية من االأخطاء وتعمل كما ه� مت�قع .فال يلزم ت�سحيح االأخطاء واالختبار.
ال تعلم اإذا كان �سي�ستمر دعم املكتبة لنف�س املدة الزمنية التي �سيتم بها ا�ستخدام مقطعك الرجمي.
حم�سنة و�سريعة. عاد ًة ما تك�ن ّ ال حاجة لتعلم خ�ارزميات معقدة لتنفيذها.
99
مكتبة البايثون القيا�سية
Python Standard Library
مكتب��ة البايث��ون القيا�س��ية ه��ي جمموع��ة دقيق��ة م��ن تراكي��ب اللغ��ة ووحداتها ودللته��ا ،ومت ت�سمينها يف توزيع البايثون القيا�س��ي ،وتتعامل املكتبة مع وظائف اأ�سا�س��ية خمتلف��ة مث��ل املدخ��الت واملخرج��ات( )Input/Output- I/Oوالوح��دات الأ�سا�س��ية الأخ��رى .وحتظ��ى لغ��ة البايث��ون ب�س��عبية كب��رية ب�س��بب كل ه��ذه الوظائ��ف ،حي��ث ت�س��م املكتب��ة القيا�س��ية اأك��رث م��ن 200وح��دة منطي��ة.
مكتبات البايثون لعلم البيانات
Python Libraries for Data Science
على الرغم من اأنه ميكنك التعامل مع البيانات يف البايثون؛ اإل اأن هناك العديد من املكتبات مفتوحة امل�سدر التي تعل م�سروعات علوم البيانات اأ�سهل بكثري .ويرد يف اجلدول التايل بع�ص املكتبات امل�ستخدمة لكل مهمة من مهام علم البيانات. اجلدول :3.2مكتبات البايثون لعلم البيانات مهام علم البيانات
املكتبات
تنقيب البيانات
Scrapy, Beautiful Soup, Requests
معاجلة البيانات/احلو�سبة العلمية
NumPy, SciPy, pandas, TensorFlow, Keras, scikit-learn, PyBrain, PyTorch, OpenCV, Mahotas
ت�سوير البيانات
Matplotlib, seaborn, Altair, Bokeh, plotly
�ست�ستخدم يف هذه الوحدة: > مكتبة منباي ( ،)NumPyللعمليات احل�سابية والريا�سية. مكتبة باندا�س ( ،)Pandasللتعامل مع البيانات والتعديل عليها بطرق خمتلفة. مكتبة مات بل�ت ليب ( ،)Matplotlibلت�سوير البيانات.
مفكرة جوبيرت
Jupyter Notebook
يف ه��ذه الوح��دة� ،ست�س��تخدم مفك��رة جوبي��رت كاأداة لتحلي��ل البيان��ات ،وه��ي تطبي��ق اإلكرتوين على الإنرتنت لإن�س��اء امل�س��تندات احل�س��ابية وم�س��اركتها .كل م�س��تند ي�س��مى مفك��رة ويت�سم��ن مقاطع��ك الربجمية وتعليقاتك وبيانات��ك الأولية واملعاجلة والبيانات امل�س��ورة ،وميكن��ك ا ً أي�س��ا تخزي��ن البيان��ات يف مل��ف خارج��ي اأو دجمه��ا يف املفك��رة. وم��ن اجلدي��ر بالذك��ر اأن بيئ��ة جوبي��رت تدع��م لغ��ات برجم��ة خمتلف��ة مبا فيه��ا البايثون، عالوة على ذلك ،ميكنك من خاللها اإن�س��اء خمرجات تفاعلية مثل HTMLاأو مقاطع الفيديو. يف ه��ذه الوح��دة� ،ست�س��تخدم الإ�س��دار غ��ري املت�س��ل باالإنرتن��ت ( )Offlineم��ن مفك��رة جوبي��رت ،واأ�س��هل طريق��ة لتثبيته��ا حمل ًي��ا ه��ي م��ن خ��الل اناك�ن��دا ( ،)Anacondaوه��ي من�سة توزيع مفتوحة امل�سدر للطلبة والهواة .ميكنك تنزيل وتثبيت اناكوندا من هنا: ،https://www.anaconda.com/products/distributionو�س��يتم تثبي��ت البايث��ون و مفك��رة جوبي��رت تلقائ ًي��ا. 100
مفك��رة جوبي��رت لي�س��ت بيئ��ة تطوي��ر متكامل��ة ( )IDEلبايث��ون ولكن مت حت�س��ينها مل�سروعات علوم البيان��ات.
لفتح مفكرة ج�بيرت: ا�سغط ( Startابداأ) 1 ،ثم ا�سغط ( Anacoda3اناكوندا.)3 اخرت ( Jupyter Notebookمفكرة جوبيرت)3 . �س��تفتح �سفح��ة ( Jupyter Notebookمفك��رة جوبي��رت) الرئي�س��ية يف املت�سفح. 2
2
3
ال�سفحة الرئي�سية لمفكرة ج�بيتر.
1
ال�سكل :3.6ال�سفحة الرئي�سية ملفكرة جوبيرت
نبذة تاريخية ع ّرف عامل الريا�سيات الأمريكي ج�ن ت�كي ( )John Tukeyحتليل البيانات يف عام 1961 على النحو التايل" :هي اإجراءات لتحليل البيانات ،وتقنيات لتف�سري نتائج هذه الإجراءات ،وطرق لتخطيط جمع البيانات جلعل حتليلها اأ�سهل واأكرث دقة ،ويف املجمل هي كل الآليات ونتائج الإح�ساءات (الريا�سية) ذات العالقة بتحليل البيانات".
101
الإن�ساء مفكرة جديدة يف ج�بيرت:
ن ن اليم� العلوية من شاشتك ،اضغط عىل ( Newجديد). > ي� الزاوية
1
حدد (( Python 3 )Ipykernelالبايثون .)3 و�ستفتح املفكرة اخلا�سة بك يف عالمة تبويب جديدة يف املت�سفح اخلا�ص بك. 2
3
1
2
يمكنك تحميل مفكرتك من جهاز الحا�سب الخا�س بك.
3
ال�سكل :3.7اإن�ساء مفكرة جديدة لنظام جوبيرت
اال�سم االفترا�سي لمفكرتك ه� بدون عن�ان. 102
�سريط اأدوات المفكرة.
خلية المقطع البرمجي. يمكنك كتابة ن�س اأو تعبير ريا�سي اأو برنامج البايث�ن.
الآن بعد اأن اأ�سبحت مفكرتك جاهزة ،حان الوقت لكتابة وت�سغيل برناجمك الأول يف مفكرة جوبيرت. الإن�ساء برنامج يف مفكرة ج�بيرت: اكتب االأوامر داخل خلية املقطع الربجمي. ا�سغط على ( Runت�سغيل)2 . و�سيتم عر�ص النتيجة حتت االأوامر3 .
1
ميكن��ك ت�س��غيل برناجم��ك بال�سغ��ط عل��ى . Enter + Shift
2
1 3
ال�سكل :3.8اإن�ساء برنامج يف مفكرة جوبيرت
عند ت�سغيل برنامجك، �ستتم اإ�سافة خلية مقطع برمجي جديدة تلقائ ًيا.
ميكن��ك احل�س��ول عل��ى العدي��د م��ن اخلالي��ا املختلف��ة الت��ي حتتاجه��ا يف نف���س املفكرةحي��ث حتت��وي كل خلي��ة عل��ى مقطعه��ا الربجم��ي اخلا���س.
معلومة ا�سم م�سروع جوبيرت هو اإ�سارة اإىل لغات الربجمة الأ�سا�سية الثالث التي يدعمها جوبيرت ،وهي جوليا ( )Juliaو البايثون ( )Pythonو .R 103
حان الوقت حلفظ املفكرة اخلا�سة بك. حلفظ املفكرة اخلا�سة بك: ا�سغط على ( Fileملف). اخرت ( Save asاحفظ ك�). اكتب ا�س ًما ملفكرتك3 . ا�سغط على ( Saveحفظ).
1 2
يت��م حف��ظ املفك��رة تلقائ ًيا اأثن��اء عمل��ك.
4
1
2
3
4
لقد تغير ا�سم المفكرة. 104
ال�سكل :3.9حفظ مفكرتك
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1يتم اإجراء حتليل البيانات الو�سفي ملعرفة �سبب حدوث �سيء ما. .2يوفر حتليل البيانات الت�سخي�سي قيمة م�سافة اأكرث من حتليل البيانات التوجيهي. .3ي�ستخدم حتليل البيانات التنبوؤي التوجهات املكت�سفة بالفعل للتنبوؤ بالنتائج امل�ستقبلية. .4حتليل البيانات التوجيهي هو اأ�سهل اأنواع حتليل البيانات. .5حتليل البيانات ال�ستك�سايف هو دائ ًما متثيل بياين للبيانات. .6مع حتليل البيانات ال�ستك�سايف ،ميكنك اكت�ساف احلالت ال�ساذة يف جمموعة البيانات. .7ياأخذ حتليل البيانات متعدد املتغريات يف العتبار اأكرث من متغري م�ستقل واحد. تب�سط العديد من مهام .8حتتوي مكتبات البايثون على حزم من املقاطع الربجمية التي ّ الربجمة. .9ل ميكن ملكتبة البايثون اأن حتتوي على بيانات التكوين اأو قوالب الر�سائل. .10مات بل�ت ليب ( )Matplotlibهي اإحدى مكتبات البايثون وتُ�ستخدم لإن�ساء الر�سوم واملخططات البيانية. 105
2ق��ارن ب��ن حتلي��ل البيان��ات التنب ��ؤي والت�جيه��ي .م��ا االختالف��ات؟ واذك��ر مث��ا ًال عل��ى كل ن���ع م��ن التحليل. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
ال اأح��ادي املتغ��ري ومثال��ن للم�س��اكل الت��ي تتطل��ب حتلي � ً 3اذك��ر مثال��ن للم�س��اكل الت��ي تتطل��ب حتلي � ً ال متع��دد املتغ��ريات ،وه��ل ميكن��ك حتدي��د التعقي��د املتزاي��د؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
4اذك��ر اإيجابي��ات و�س��لبيات ا�س��تخدام مكتب��ات البايث���ن مقارن��ة بكتاب��ة املقاط��ع الرجمي��ة اخلا�س��ة ب��ك ،وما النهج الذي �س��تختاره؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
106
5اأن��ت حمل��ل بيان��ات يف �س��ركة تري��د معرف��ة كيفي��ة ت�زي��ع نفقاته��ا يف جم��االت خمتلف��ة ،فم��ا ن���ع حتلي��ل البيان��ات ال��ذي �س��تطبقه؟ ومل��اذا؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
6ما امليزة الرئي�سية ال�ستخدام مفكرة ج�بيرت؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
7اأن�سئ مفكرة جديدة يف ج�بيرت: اطبع الر�سالة "هذه مفكرتي االأوىل". احفظ مفكرتك با�سم من اختيارك. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
107
الدر�س الثاين
مكتبات البايثون لتحليل البيانات يف الدر�ص ال�سابق ،مت التطرق اإىل اأن البايثون ي�ستخدم املكتبات من اأجل التعامل مع البيانات .يف هذا الدر�ص �ستتعلم طريقة توظيف مكتبات البايثون يف مفكرة جوبيرت اخلا�سة بك.
مكتبة منباي
NumPy Library
يرمز ا�سم مكتبة منباي ( )NumPyاإىل البايث�ن العددي ( ،)Numerical Pythonوهي مكتبة قيا�سية للعمل مع البيانات العددية يف البايثون ،ميكن ا�ستخدامها لإجراء جمموعة متنوعة من العمليات الريا�سية على امل�سفوفات. اجلدول :3.3وظائف مكتبة نيمباي وظيفة
املعنى
(add)arr1, arr2,...
اإ�سافة امل�سفوفات.
(multiply)arr1,arr2,...
�سرب امل�سفوفات.
(absolute)arr
تُرجع القيمة املطلقة لكل عن�سر يف امل�سفوفة املدخلة.
(maximum)arr1,arr2,...
تُرجع القيمة الق�سوى يف امل�سفوفة املدخلة.
وظيفة (:)Method
ه��ي دال��ة مرتبط��ة بكائ��ن ( )Objectويت��م تعريفه��ا داخل الفئة ( .)Classعلى �سبيل املثال: (.np.add)arr1, arr2
ابداأ باإن�ساء قائمة ب�سيطة يف مفكرة جوبيرت اخلا�سة بك .هذه قائمتك: م�سف�فة (:)Array
ه��ي ن��وع م��ن البيان��ات ميكن��ه الحتفاظ بعدد ثابت من القيم الت��ي لها نف���ص نوع البيانات.
ال�سكل :3.10و�سع قائمة يف مفكرة جوبيرت
ا�ستخدم مكتبة منباي ،ويف هذا املقطع الربجمي �ست�ستخدم وظيفة القيمة املطلقة (() )absoluteلطباعة القيم املطلقة للقائمة. عند ا�ستخدام مكتبة ،يمكنك اأن تعطيها ا�س ًما ال�ستخدام وظائفها في مقطعك البرمجي.
ال�سكل :3.11ا�ستخدام مكتبة نمباي
108
عند ا�ستخدام وظيفة من المكتبة ،اكتب ا�سم المكتبة ثم نقطة ثم ا�سم الدالة.
مكتبة باندا�س
Pandas Library
تاأخذ مكتبة باندا�ص البيانات وتن�سئ كائن البايثون ،وهناك نوعان رئي�سيان من الكائنات: املت�سل�س��لة ( :)Seriesعب��ارة ع��ن م�سفوف��ة اأحادي��ة البع��د ق��ادرة عل��ى حم��ل اأي ن��وع م��ن البيان��ات (االأع��داد ال�سحيح��ة ( ،)Integersوال�سال�س��ل الن�سي��ة ( ،)Stringsواالأرق��ام الع�س��رية ( ،)Floatsوكائن��ات البايث��ون وغريه��ا). اإطار البيانات ( :)DataFrameهو هيكل بيانات ثنائي الأبعاد يبدو م�ساب ًها جدً ا جلدول يف ورقة عمل اإك�سل. ل��كل كائ��ن اأ�س��اليبه و�س��ماته اخلا�س��ة .ميكن��ك اإن�س��اء مت�سل�س��لة اأو اإط��ار بيان��ات م��ن ال�سف��ر (م��ن القوائ��م والقوامي���ص وم��ا اإىل ذل��ك) كم��ا ميك��ن ا�س��ترياد البيان��ات م��ن م�س��ادر البيان��ات ،مث��ل اإك�س��ل و ،CSVو ،SQLو ،JSONواملزي��د. اجلدول :3.4االختالفات بني مكتبات باندا�س ونيمباي باندا�س
نيمباي
اأنواع البيانات
يعمل مع البيانات املجدولة.
يعمل مع البيانات العددية.
اأنواع الكائنات
مت�سل�سلة ( ،)Seriesاإطار البيانات (.)DataFrame
م�سف�فات.
االأداء
يتعامل مع مئات االآالف من البيانات.
يعالج خم�سن األف �سف اأو اأقل.
ا�ستخدام الذاكرة
ي�ستهلك املزيد من الذاكرة.
ي�ستهلك ذاكرة اأقل.
اال�ستخدام
حتليل البيانات وت�س�يرها.
اإجراء احل�سابات.
كائن املت�سل�سلة Series Object
الآن� ،ستقوم بتحويل هذه القائمة اإىل كائن املت�سل�سلة .للقيام بذلك ،عليك ت�سمني مكتبة باندا�ص يف مفكرتك .ول�ستخدام مكتبة يف البايثون، ميكنك اإ�سافة كلمة ا�سترياد ( )Importوا�سم املكتبة يف بداية مقطعك الربجمي.
يف مفك��رة جوبي��رت ،عليك ا�س��ترياد املكتبة مرة واحدة فقط ثم ميكنك ا�ستخدامها يف املفكرة باأكملها.
ال�سكل :3.12حتويل قائمة اإىل كائن املت�سل�سلة
109
�سمات كائن املت�سل�سلة
Attributes of Series Object
�سيوعا التي ميكنك ا�ستخدامها لكائن املت�سل�سلة. يف اجلدول 3.5يتم تقدمي بع�ص ال�سمات الأكرث ً اجلدول � :3.5سمات كائن املت�سل�سلة ال�سمة
املعنى
name
تُرجع ا�سم املت�سل�سلة.
size
تُرجع حجم املت�سل�سلة.
is_unique
تُرجع �س�اب ( )Trueاإذا كانت قيم كائن املت�سل�سلة فريدة، واإل فاإنها تُرجع خطاأ (.)False
hasnans
تُرجع �س�اب ( )Trueاإذا كان كائن املت�سل�سلة املعطى لديه قيم مفقودة ،واإل فاإنها تُرجع خطاأ (.)False
ط ّبق بع�ص هذه ال�سمات يف كائن املت�سل�سلة.
ال�سكل :3.13ال�سمات يف كائن املت�سل�سلة
110
ال�سمة (:)Attribute
قيم��ة مرتبط��ة بالكائ��ن ال��ذي ي�س��ار اإلي��ه بال�س��م با�س��تخدام تعب��ريات منقط��ة. عل��ى �س��بيل املث��ال ،اإذا كان الكائ��ن طال��ب ( )studentوكان��ت ال�س��مة درج��ة (،)grade ف�س��يتم الإ�س��ارة اإليه��ا .student.grade
يف احلو�س��بة NaN ،ترم��ز اإىل لي�س رق ًما (.)Not a Number
كائن اإطار البيانات
DataFrame Object
وا�ستخداما هي اإك�سل .ميكنك العمل مع ملفات اإك�سل يف مفكرة جوبيرت با�ستخدام مكتبة باندا�ص .لفتح ملف اإك�سل يف �سيوعا الأداة التحليلية الأكرث ً ً مفكرة جوبيرت ،حتتاج اإىل اأن تكون هذه امللفات (ملف الإك�سل واملفكرة) يف نف�ص املجلد. مكتبة نظام الت�سغيل OS Library
للتحق��ق م��ن مل��ف العم��ل اخلا���ص ب��ك ،ميكن��ك ا�س��تخدام مكتب��ة نظ��ام الت�س��غيل ( ،)OSحي��ث اأنه��ا توف��ر يف بايث��ون وظائ��ف لإن�س��اء واإزال��ة دلي��ل (جمل��د) ،وجل��ب حمتويات��ه ،وتغي��ري اأو حتدي��د املجل��د احل��ايل ،اإىل اأخ��ره. getcwdيرمز اإلى اح�سل على مجلد العمل الحالي
(.)get current working directory
هذا هو ملف الإك�سل اخلا�ص بك.
ال�سكل :3.14مكتبة نظام الت�سغيل
ال�سكل saudischools.xlsx :3.15ملف اإك�سل
اإن جمموع��ة البيان��ات الت��ي �ست�س��تخدمها يف ه��ذا الدر���س ُم َقدّ م��ة م��ن قب��ل وزارة التعليم من خالل املن�سة ال�سعودية للبيانات املفتوحة .https://data.gov.saميكنك ا�ستخدام بيانات ملف اإك�سل لغر�س هذا الدر�س باتباع �سيا�سات البيانات املفتوحة .https://data.gov.sa/ar/policies 111
الآن� ،ستقوم بتحويل ملف الإك�سل التايل اإىل اإطار البيانات ملعاجلة بياناته.
ال�سكل :3.16اإن�ساء اإطار بيانات
اإذا كان مل��ف االإك�س��ل يحت��وي عل��ى اأوراق عم��ل متع��ددة ،ميكن��ك ق��راءة ورق��ة عم��ل حم��ددة .ت�س��تخدم وظيف��ة باندا���س ( )read_excelمتغ��ري ي�س��مى ( )sheet_nameتخ��رب باندا���س بورق��ة العم��ل الت��ي يج��ب قراءته��ا م��ن البيان��ات املُتاح��ة يف مل��ف االإك�س��ل .اإذا ل حت��دد الورق��ة ،فاإنه��ا �س��تقراأ ورق��ة العمل االأوىل.
�سمات كائن اإطار البيانات
Attributes of a DataFrame Object
�سيوعا ،والتي ميكنك توظيفها يف احل�سول على معلومات حول اإطار البيانات. يف اجلدول التايل ،يتم تقدمي بع�ص ال�سمات الأكرث ً اجلدول � :3.6سمات كائن اإطار البيانات
112
ال�سمة
املعنى
shape
ُترجع اأبعاد اإطار البيانات.
size
ُترجع العدد االإجمايل للعنا�سر يف اإطار بيانات ()n x m
dtypes
ُترجع ن�ع القيمة لكل عم�د.
columns
ُترجع اأ�سماء اأعمدة اإطار البيانات.
axes
ُترجع عدد ال�سف�ف واأ�سماء االأعمدة.
يمكنك اإ�سافة تعليقات اإلى مقطعك البرمجي با�ستخدام ( )#في بداية العبارة.
ال�سكل :3.17ا�ستخدام اخل�سائ�ص على كائن اإطار البيانات
اجلدول :3.7اأنواع بيانات باندا�س نوع بيانات باندا�س
نوع بيانات البايثون
object
str or mixed
int64
int
float64
float
bool
bool
datetime64
NA
]timedelta[ns
NA
category
NA
في مكتبة باندا�س، عادة ما يك�ن ن�ع بيانات الكائن �سل�سلة ن�سية .string.data
113
الفهر�سة Indexing
الفهر�ص ( )Indexهو قائمة بالأعداد ال�سحيحة اأو الت�سميات التي ت�ستخدمها لتحديد ال�سفوف اأو الأعمدة ب�سكل فريد .يف باندا�ص ،تت�سمن الفهر�سة ب�سكل اأ�سا�سي اختيار �سفوف واأعمدة حمددة من البيانات من اإطار البيانات ،حيث ميكن اختيار جميع ال�سفوف وبع�ص الأعمدة ،اأو اختيار بع�ص ال�سفوف وجميع الأعمدة ،اأو بع�ص من كل �سف وعمود .اختيار املجم�عة الفرعية ( )Subset Selectionهو م�سطلح اآخر للفهر�سة. لت�ساهد بع�ص الأمثلة على الوظائف التي ميكنك ا�ستخدامها للفهر�سة. اجلدول :3.8وظائف الفهر�سة الوظيفة
املعنى
()head
ُترجع العنا�سر االأوىل من الكائن.
()tail
ُترجع العنا�سر االأخرية من الكائن.
()value_counts
ُترجع القيم الفريدة للكائن.
()idxmax
ُترجع قيمة فهر�س العن�سر االأق�سى.
()idxmin
ُترجع قيمة فهر�س العن�سر االأدنى.
ا�ستخدام الفهر�سة يف كائن املت�سل�سلة
Using Indexing in a Series Object
ط ّبق وظائف الفهر�سة هذه على كائن املت�سل�سلة الذي قمت باإن�سائه .اطبع كائن املت�سل�سلة ا ًأول ،لتذكر حمتوياته.
كائن المت�سل�سلة.
114
القيمة االفترا�سية لعدد ال�سف�ف لل�ظيفتين ()head و() tailهي 5لكل من المت�سل�سلة و اإطار البيانات.
ال�سكل :3.18ا�ستخدام الفهر�سة يف كائن املت�سل�سلة
115
ا�ستخدام الفهر�سة يف كائن اإطار البيانات
116
Using Indexing in DataFrame Object
طباعة اأ�سماء اأعمدة اإطار البيانات.
ت�ستخدم وظيفة () describeلعر�س بع�س التفا�سيل االإح�سائية االأ�سا�سية.
ال�سكل :3.19ا�ستخدام الفهر�سة يف كائن اإطار البيانات
117
ت�سفية البيانات اأو اختيار جمموعة بيانات جزئية
Filtering Data or Subset Selection
يف بع���ص الأحي��ان ل حتت��اج اإىل جمموع��ة البيان��ات باأكمله��ا .حتت��اج اإىل ع��زل بع���ص البيان��ات املح��ددة. للقيام بذلك ،حتتاج اإىل اإ�سافة بع�ص املر�سحات .هناك العديد من الأ�ساليب لختيار جمموعة جزئية من اإطار البيانات اأو مت�سل�سة .الأ�سلوب الأ�سهل هو ا�ستخدام الفهر�سة املنطقية (،)Boolean Indexing ولك��ن الأ�س��لوب الأك��رث ق��وة ه��و با�س��تخدام ط��رق locو .ilocاأو ًل �س��تتعلم الفهر�س��ة املنطقي��ة ث��م اأ�س��لوب locو .iloc الفهر�سة املنطقية Boolean Indexing
هي نوع من الفهر�سة التي ت�ستخدم القيم الفعلية ملجموعة البيانات ،وفيها حتت��اج اإىل ا�س��تخدام املُعامِ ��الت املنطقي��ة ( ،)Boolean Operatorوتُكت��ب عامالت املنطقية ب�سكل خمتلف يف مفكرة جوبيرت عن بايثون. املُ ِ
اجلدول :3.9املُعا ِمالت املنطقية يف مفكرة جوبيرت
لت�ساهد بع�ص الأمثلة على كائن املت�سل�سلة.
ال�سكل :3.20ت�سفية البيانات يف الكائنات املت�سل�سلة
118
ت�سفية البيانات: ت�سفية البيانات هو عملية اختيار جزء اأ�سغر من جمموعة البيانات اخلا�سة بك وا�ستخدام تلك املجموعة اجلزئية للعر�ص اأو التحليل.
جوبيرت
بايثون
&
and
|
or
~
not
الفهر�سة مع اأ�سلوب Locو Indexing with Loc and Iloc Methods Iloc
�سيوعا للفهر�سة يف مكتبة باندا�ص. تُعد طريقتي ilocو � locسمن الطرق الأكرث ً :locيختار ال�سفوف والأعمدة مع م�سميات حمددة (اأ�سماء الأعمدة). :ilocيختار ال�سفوف والأعمدة يف موا�سع الأعداد ال�سحيحة املحددة (اأرقام ال�سفوف والأعمدة). واإليك اأدناه بع�ص الأمثلة على اأ�ستخدام كائن اإطار البيانات باأ�سلوب ().loc يف هذا املثال� ،ست�ستخدم طريقة () locلطباعة ال�سفوف اخلم�سة الأوىل من عمودين حمددين.
ال�سكل :3.21طباعة ال�سفوف اخلم�سة الأوىل من عمودين حمددين
يف هذا املثال� ،ستقوم بطباعة �سفوف اإطار البيانات التي لها قيمة حمددة يف عمود معني.
ال�سكل :3.22طباعة �سفوف اإطار البيانات التي لها قيمة حمددة يف عمود حمدد
119
يف ه��ذا املث��ال� ،ستن�س��ئ اإط��ار بيان��ات جدي��دً ا ي�س��مى .studentsRegو�س��يحتوي اإط��ار البيان��ات ه��ذا عل��ى عمودي��ن :عم��ود واح��د للمنطقة واآخر لعدد الطلبة.
ال�سكل :3.23اإن�ساء اإطار بيانات جديد ي�سمى studentsReg
والآن� ،سوف ت�ستخدم طريقة () ilocلتحديد جميع عنا�سر ال�سف الأول من اإطار البيانات. تذكر ،الفهر�سة في بايث�ن تبداأ من .0
ال�سكل :3.24طباعة عنا�سر ال�سف الأول من اإطار البيانات
120
ويف الأمثلة اأدناه� ،ستطبع عنا�سر حمددة من اإطار البيانات.
ال�سكل :3.25طباعة عنا�سر حمددة من اإطار البيانات
طباعة العنا�سر في ال�سفين الثاني والثالث ،ولكن فقط من االأعمدة 0و 1و .2
ويف هذا املثال� ،سوف ت�ستخدم حلقة forلطباعة ال�سفوف ش الع�ة الأوىل من العمود الأول من اإطار بيانات .studentsReg
ال�سكل :3.26العنا�سر املطبوعة لإطار البيانات
121
املجموعات والتجميع
Grouping and Aggregating
ت�س��مى عملي��ة و�س��ع عنا�س��ر جمموع��ة البيان��ات يف جمموع��ات بن��ا ًء عل��ى بع���ص املعاي��ري وتطبي��ق الوظائف على هذه املجموعات بالتجميع .يف مكتبة باندا�ص؛ يتم تنفيذ هذا الإجراء با�ستخدام وظيفة (().)df.groupby فعل��ى �س��بيل املث��ال ،تخي��ل اأن لدي��ك جمموع��ة بيان��ات لأف�س��ل ه�دّايف ك��رة ال�س��لة يف كل الع�س��ور. اإذا كنت ترغب يف معرفة عدد الالعبني يف جمموعة البيانات هذه لفريق معني ،فيمكنك تميع ه��ذه البيان��ات ح�س��ب عم��ود "الفري��ق" وتطبي��ق دال��ة املجم��وع (() )sumعلى البيان��ات املج ّمعة.
وظيفة Groupby Groupby Method
با�س��تخدام وظيف��ة () groupbyميكن��ك تق�س��يم بيانات��ك اإىل جمموع��ات خمتلف��ة، وميكن اأن ي�ساعدك هذا يف اإجراء ح�سابات لتحليل البيانات ب�س��كل اأف�سل.
اجلدول :3.10الدوال التجميعية الدالة
املعنى
sum
ُترجع جمم�ع قائمة االأرقام.
max
ُترجع العدد االأق�سى لقائمة االأرقام.
min
ُترجع العدد االأدنى لقائمة االأرقام.
mean
ُترجع مت��سط قائمة االأرقام.
لت�ساهد بع�ص الأمثلة لوظيفة () df.groupbyيف اإطار البيانات اجلديد الذي اأن�ساأته. يف هذا املثال� ،ستقوم بتجميع الطلبة وف ًقا ملنطقتهم وحت�سب جمموع الطلبة يف كل منطقة.
دالة sumهي اإحدى دوال التجميع التي تدعمها مكتبة باندا�س.
ال�سكل :3.27ا�ستخدام وظيفة () df.groupbyلتجميع اإطار البيانات بعمود واحد
122
دالة التجميع: دال��ة تق��وم بح�س��ابات ريا�سي��ة م��ع قي��م �سف��وف متع��ددة والت��ي يت��م تميعه��ا م ًعا، ونتيج��ة لذل��ك ترجع قيم��ة موجزة واحدة. �يوعا ه��ي sum، دوال التجمي��ع الأك��رث �س� ً .count، max، min and mean
يف هذا املثال� ،ستقوم بتجميع الطلبة وف ًقا ملعيارين ،منطقتهم ومرحلتهم الدرا�سية ،وحت�سب جمموع الطلبة يف كل منطقة. جمموعة املنطقة الأوىل
�سبطنا as_index=false
ليك�ن الفهر�س ه� رقم ال�سف بد ًال من اأ�سماء االأعمدة.
جمموعة املنطقة الأخرية
ال�سكل :3.28ا�ستخدام وظيفة () df.groupbyلتجميع اإطار البيانات يف اأعمدة متعددة
ويف ه��ذا املث��ال� ،س��تقوم باإن�س��اء اإط��ار بيان��ات جدي��د للمنطق��ة وع��دد الطلب��ة وع��دد املعلم��ني .ث��م تم��ع ح�س��ب املنطق��ة وحت�س��ب جمم��وع الطلب��ة وجمم��وع املعلم��ني يف كل منطق��ة.
ال�سكل :3.29ا�ستخدام وظيفة () df.groupbyوحتديد العمود امل�سنف كموؤ�سر للبيانات اجلديدة
123
تنظيف البيانات
Data Cleaning
من املهم جدً ا اأن تكون البيانات التي �ستحللها �سحيحة ،قبل البدء بتحليلها ،وهذا يعني اأنه يجب اإزالة البيانات املكررة اأو امل�س ّو�سة اأو غري الدقيقة من جمموعة البيانات اخلا�سة بك ،واإذا بقيت هذه البيانات كما هي ،فلن تكون نتائج حتليلها �سحيحة.
اإ�سالح البيانات
تنظيف البيانات: تنظي��ف البيان��ات ه��و عملي��ة اإ�س��الح اأو اإزال��ة البيان��ات غ��ري ال�سحيح��ة اأو امل�س ّو�س��ة اأو املن�سقة ب�سكل غري �سحيح اأو املكررة اأو غري املكتملة من جمموع��ة البيان��ات.
اجلدول :3.11وظائف تنظيف البيانات الوظيفة
املعنى
()duplicated
ُترجع قيمة منطقية لكل �سف يحت�ي على بيانات مكررة.
()value_counts
ُترجع القيم الفريدة يف جمم�عة البيانات.
اإزالة البيانات املكررة
()isnull
ُترجع قيمة منطقية لكل خلية فارغة من جمم�عة البيانات.
ال�سكل :3.30عملية تنظيف البيانات
()dropna
يحذف ال�سف�ف الفارغة.
اإ�سالح اخلاليا الفارغة
البيانات املكررة
Duplicated Data
للتحقق مما اإذا كانت جمموعة البيانات اخلا�سة بك حتتوي على بيانات مكررة ،فيمكنك اأن ت�س��تخدم الوظيفة () .df.duplicatedوتعطي هذه الوظيفة قيمة منطقية لكل �سف ح�سب احتواءه على بيانات مكررة. �س�اب ( )Trueللبيانات املكررة. خطاأ ( )Falseللبيانات غري املكررة. �سرتى كيفية التعامل مع ال�سفوف املكررة يف جمموعة البيانات.
ال�سكل :3.31ا�ستخدام وظيفة ()df.duplicated
124
عدد الن�سخ المكررة
يوجد يف جمموعة البيانات اخلا�سة بك � 171س ًفا مكر ًرا. حلذف هذه ال�سفوف ت�ستخدم وظيفة () ،drop_duplicatesحيث حتذف هذه الطريقة ال�سفوف املكررة. بعد حذف ال�سفوف املكررة ،عليك حتديث جمموعة البيانات اخلا�سة بك للتحقق من اإزالة ال�سفوف املكررة.
ال ي�جد �سف�ف مكررة.
ال�سكل :3.32ا�ستخدام وظيفة ()drop_duplicates
اخلاليا الفارغة
Empty Cells
للتحق��ق مم��ا اإذا كان��ت جمموع��ة البيان��ات اخلا�س��ة ب��ك به��ا قي��م مفق��ودة ،ميكن��ك ا�س��تخدام وظيف��ة () ،data.isnullحي��ث ترج��ع قيم��ة منطقي��ة ل��كل خلية م��ن جمموعة البيانات: �س�اب ( )Trueللخاليا الفارغة خطاأ ( )Falseللخاليا املمتلئة �سرتى كيف ميكنك عد اخلاليا الفارغة يف جمموعة البيانات. يف هذا املثال حت�سب اخلاليا الفارغة لكل عمود.
عدد الخاليا الفارغة في كل عم�د.
ال�سكل :3.33عد اخلاليا الفارغة لكل عمود
ميكنك روؤية عدد اخلاليا الفارغة يف كل عمود. حلذف هذه ال�سفوف ،ت�ستخدم وظيفة () ،dropnaو�ستقوم بحذف ال�سفوف الفارغة. بعد حذف ال�سفوف الفارغة ،عليك حتديث جمموعة البيانات اخلا�سة بك للتحقق من اإزالة هذه ال�سفوف.
125
ال ي�جد خاليا فارغة
ال�سكل :3.34حذف ال�سفوف الفارغة
البيانات اخلاطئة
Wrong Data
يف بع�ص الأحيان قد حتتوي جمموعة البيانات اخلا�سة بك على بيانات خاطئة .فعلى �سبيل املثال ،يف جمموعة البيانات اخلا�سة بك ل ميكنك احل�سول عل��ى اأرق��ام �س��البة يف ع��دد عم��ود الطلب��ة ،وللتحق��ق مم��ا اإذا كان��ت جمموع��ة البيان��ات اخلا�س��ة ب��ك حتتوي عل��ى بيانات خاطئة ،عليك كتاب��ة مقطع برجمي خم�س�ص على ح�سب جمموعة البيانات اخلا�سة بك. يف هذا املثال �سوف تتحقق من الأرقام ال�سالبة يف اأعمدة جمموعة البيانات. يعتم��د ن��وع البيان��ات الت��ي ميك��ن اعتباره��ا خاطئ��ة عل��ى جمموع��ة البيان��ات .علي��ك اأن تق��رر م��اذا تفع��ل به��ذه البيان��ات اخلاطئ��ة ،فق��د ترغ��ب يف حذفه��ا اأو ا�س��تبدالها بقي��م اأخرى.
ال�سكل :3.35التحقق من الأرقام ال�سالبة
126
مترينات 1قارن بن كائن املت�سل�سلة و اإطار البيانات. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
� 2سف الفرق بن فهر�سة البيانات وت�سفيتها. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
3ا�سرح اأهمية تنظيف البيانات قبل البدء بتحليلها. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
127
4ا�ست�رد املكتبة الع�س�ائية وا�ستخدم وظيفة () random.randrangeلطباعة رقم ع�س�ائي بن 1و .100 ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
5افتح مفكرة جديدة يف ج�بيرت ،وا�ست�رد ملف اإك�سل باال�سم "."tourist-indicators.xlsx ح ّمل ورقة العمل " "I8يف اإطار بيانات باندا�س. اطبع �سكل اإطار البيانات. اطبع اأن�اع البيانات املخزنة يف كل عم�د من جمم�عة البيانات. اطبع اأ�سماء اأعمدة جمم�عة البيانات.
128
6ا�ستخدم جمم�عة البيانات التي ا�ست�ردتها يف التمرين ال�سابق وقم بالتايل: اأن�سئ كائن مت�سل�سلة جديد يحت�ي على عدد ال�سياح ال�افدين من دول جمل�س التعاون اخلليجي. اأوجد احلد االأق�سى واحلد االأدنى لعدد ال�سياح ويف اأي �سف�ف من املت�سل�سلة حتدث هذه القيم؟ حتقق من املت�سل�سلة ملعرفة القيم غري املنا�سبة واملفق�دة ،واإذا كان هناك اأي منها ،قم باإزالة تلك ال�سف�ف.
7
اطبع عدد ال�سياح بالرتتيب التنازيل لقيم اأكر من .500
7افتح ورقة العمل " "I8من امللف " "tourist-indicators.xlsxواقراأها يف اإطار بيانات جديد .ثم: َتف ّقد جمم�عة البيانات باأكملها ملعرفة القيم املكررة واملفق�دة. اطبع عدد القيم املفق�دة وعدد ال�سف�ف املكررة. قم باإزالة ال�سف�ف املكررة وال�سف�ف ذات القيم املفق�دة. قم بتجميع اإطار البيانات بناء على ال�سهر ،وحدد ال�سهر الذي ا�ستقطب اأكر عدد من الزوار لكل منطقة.
129
الدر�س الثالث
ت�سوير البيانات ً وحتليال. كما ذكر �س��اب ًقا ،فاإن ت�سوير البيانات هو التمثيل البياين للمعلومات والبيانات .اإن ت�سوير البيانات يجعلها اأي�س��ر فه ًما با�ستخدام العنا�سر املرئية مثل املخططات والر�سوم البيانية واخلرائط ،فاإنك تعل البيانات اأكرث �سهولة وفه ًما وقابلية لال�ستخدام. يف هذا الدر�ص� ،ست�ستخدم مفكرة جوبيرت لت�سوير بياناتك .ويدعم جوبيرت ت�سوير البيانات بال�ستعانة مبكتبات البايثون.
اأنواع ت�سوير البيانات
Types of Data Visualization
�سيوعا هي: اأكرث اأنواع ت�سوير البيانات ً املخططات (اخلطية ،ال�سريطية ،الدائرية) الر�سوم البيانية املخطط النقطي املخطط املد ّرج التكراري اجلداول اخلرائط
يت��م متثي��ل البيان��ات ب�س��كل خمتل��ف با�س��تخدام االأن��واع املختلف��ة لت�سوي��ر البيان��ات .،يج��ب علي��ك اختي��ار ن��وع الر�س��م البياين ح�سب ما تريد حتقيقه من تقريرك.
ال�سكل :3.36الر�سوم الأكرث �سيوعا يف ت�سوير البيانات
130
املخططات
Charts
املخطط ّ اخلطي
Line Chart
املخطط ّ اخلطي هو تقنية ت�سوير بيانات ،بحيث يتم ر�س��م كل قيمة ملتغري م�س��تقل على مدى فرتة زمنية وتت�سل هذه القيم بخطوط م�س��تقيمة .عادة ما يكون املحور الأفقي متغ ًريا م�ستم ًرا مثل الوقت ،واملحور الراأ�سي هو قيم املتغري امل�ستقل .وتكمن بع�ص املزايا يف ب�ساطته يف متثيل تغيري املتغري مبرور الوقت والذي ميكن اأن ي�ساعد يف اكت�س��اف التوجهات والأمناط .وميكنك ر�س��م خطوط متعددة على نف���ص الر�س��م البياين ومقارنة تقدم اأكرث من متغري م�ستقل واحد يف نف�ص الفرتة الزمنية. ال�سكل :3.37خمطط ّ خطي يو�سح املتو�سط ال�سنوي لدرجات احلرارة املنخف�سة واملتو�سطة امل�سجلة يف اأَ ْب َها
املخطط ال�سريطي
Bar Chart
املخط��ط ال�س��ريطي مي ّث��ل عنا�س��ر متغ��ري فئ��وي عل��ى املح��ور الأفق��ي (���ص) ،بينم��ا تو�سح الأعمدة قيم تلك العنا�سر من خالل ارتفاعها ن�سبة اإىل قيم املحور الراأ�سي (���ص) .ميك��ن اأن تك��ون املخطط��ات ال�س��ريطية عمودي��ة اأو اأفقي��ة ،وع��ادة م��ا ت�س��مى املخطط��ات ال�س��ريطية العمودي��ة خمطط��ات الأعم��دة .وهن��اك العدي��د م��ن اأن��واع املخططات ال�سريطية مثل املخططات ال�سريطية املج ّمعة ،واملخططات ال�سريطية املكدّ�س��ة ،واملخطط��ات ال�س��ريطية مع اأ�س��رطة اخلط�اأ ،وغريهااملزيد. ال�سكل :3.38خمطط �سريطي يو�سح املتو�سط ال�سنوي لدرجات احلرارة املنخف�سة واملتو�سطة امل�سجلة يف اأَ ْب َها
املخطط النقطي
Scatter Plot
املخط��ط النقط��ي ه��و طريق��ة لت�سوي��ر البيان��ات با�س��تخدام النق��اط لتمثي��ل قي��م املتغريات املختلفة ،وتكون هذه النقاط مبعرثة على ال�س��كل ،ومن هنا جاء ال�س��م. موقع هذه النقط على حموري (�ص) و (�ص) ميثل قيمها ،وميكنك ا�ستخدام األوان خمتلفة لر�سم النقاط ،حيث ميثل كل لون متغري معني .وعندما تكون قيم املتغريات الت��ي مت��ت درا�س��تها بيان��ات متقطعة ،ف�اإن املخطط النقطي يك��ون اأكرث مالءمة من املخطط ّ اخلطي ،حيث اأنه اأكرث قابلية للتطبيق لتمثيل املتغريات ذات القيم امل�ستمرة (احلقيقي��ة) .وهن��اك اأن��واع خمتلف��ة م��ن املخط��ط النقط��ي بن��ا ًء عل��ى الرتباط بني املتغريات (ايجابي� ،س��لبي ،لغي). ال�سكل :3.39خمطط نقطي يبني وجود ارتباط اإيجابي بني �سنوات اخلربة وعمر املوظف
131
املخطط الدائري
Pie Chart
مق�س��م اإىل �س��رائح متث��ل القي��م الن�س��بية املخط��ط الدائ��ري ه��و خمط��ط ي�س��به الفطائ��رّ ، لبع�ص املتغريات يف فئة معينة .متثل كل �سريحة من املخطط فئة خمتلفة .هناك العديد من اأنواع املخططات الدائرية ،مثل املخططات الدائرية املج ّ�فة ()Doughnut Charts واملخطط��ات ن�س��ف املج ّ�ف��ة ( )Half-Doughnut Pie Chartsواملخطط��ات الدائري��ة متعددة الطبقات (.)Multilayered Pie Charts ال�سكل :3.40خمطط دائري يبني الن�سبة املئوية لو�سيلة النقل املف�سلة
املخطط املد ّرج التكراري
Histogram
يعد املخطط املد ّرج التكراري (الهي�ستوقرام) اأحد اأقدم تقنيات ت�سوير البيانات ،حيث ي�سبه املخططات ال�سريطية ولكنه يختلف عنها يف اأنه يظهر تواتر البيانات العددية ،بينما املخطط��ات ال�س��ريطية ُتع��د طريق��ة ملقارن��ة فئ��ات البيان��ات .وعندم��ا تريد اإن�س��اء خمطط امل��د ّرج التك��راري ،فعلي��ك بتجمي��ع البيان��ات يف نطاق��ات يت��م ر�س��مها بع��د ذل��ك عل��ى �س��كل اأعمدة مت�سلة ببع�سها البع�ص ،و ُيظهر ارتفاع الأعمدة عدد البيانات املوجودة يف كل نطاق. البيان��ات الفئوي��ة ه��ي متغ��ريات متقطع��ة ،وميك��ن اأن يك��ون له��ا ع��دد مع��ني من القيم ،فعلى �س��بيل املثال عدد الطلبة يف كل منطقة من اململكة العربية ال�س��عودية .وميك��ن اأن يك��ون للبيان��ات امل�س��تمرة اأي قيم��ة ب��ني احل��د االأدن��ى والقيم��ة الق�س��وى ،عل��ى �س��بيل املث��ال ،الوقت اأو درج��ة احلرارة.
مكتبة مات بلوت ليب
Matplotlib Library
م��ن اأج��ل ت�سوي��ر بيانات��ك ،حتت��اج اإىل ا�س��ترياد مكتب��ة جدي��دة ،وهي التي ت�س��مى مات بلوت ليب .وحتتوي هذه املكتبة على بع�ص الأ�ساليب اجلاهزة التي ميكنك ا�ستخدامها جلع��ل املخط��ط اخلا���ص ب��ك اأك��رث قابلية للفه��م ،وميكنك الطالع على هذه الأ�س��اليب يف اجل��دول .3.12وبا�س��تخدام ه��ذه املكتب��ة ،ميكن��ك تق��دمي بيانات��ك يف اأي خمط��ط تريده .يف هذا الدر���ص� ،ست�س��تخدم هذه الأ�س��اليب لإن�س��اء خمططات بنا ًء على اإطار البيان��ات اخلا�ص بك. لدع��م الن���ص العرب��ي داخ��ل املخطط��ات الت��ي اأن�س�اأتها مكتب��ة م��ات بل��وت لي��ب ،حتت��اج اإىل حتويل الن�ص العربي اإىل تن�سيق ميكن عر�سه ب�سكل �سحيح� .ست�ستخدم مكتبتي البايثون:
يبني توزيع �سنوات اخلربة بني ال�سكل :3.41خمطط مد ّرج تكراري ُ ّ املوظفني اجلدول :3.12طرق مكتبة مات بلوت ليب ()Matplotlib
الطريقة
املعنى
()bar
ين�سئ خمطط �سريطي.
()pie
ين�سئ خمطط دائري.
()set_title
يحدد عن�ان املخطط.
()set_ylabel
يحدد ت�سمية حم�ر .y
()set_xlabel
يحدد ت�سمية حم�ر .x
()show
ين�سئ املخطط.
> arabic_reshaper > bidi.algorithm
من خالل ت�سغيل املقطع الربجمي التايل يف مفكرة جوبيرت اخلا�سة بك ،يتم تنزيل هاتني املكتبتني وتثبيتهما تلقائ ًيا.
ال�سكل :3.42تنزيل وتثبيت املكتبات
132
املخطط ال�سريطي
Bar Chart
حان الوقت لإن�ساء اأول خمطط لك يف مفكرة جوبيرت. ابداأ با�سترياد املكتبات التي �ست�ستخدمها.
ال�سكل :3.43املكتبات امل�ستوردة
اخلطوة التالية هي اإن�ساء جمموعة البيانات التي �ست�ستخدمها. م��ن جمموع��ة البيان��ات الت��ي ا�س��تخدمتها يف الدر���ص ال�س��ابق ،اب��داأ بتجمي��ع بيانات��ك ح�س��ب املنطق��ة با�س��تخدام دال��ة () meanواح�س��ل عل��ى متو�س��ط عدد الطلب��ة واملعلمني والإداريني. قم بفرز اإطار البيانات هذا ح�سب عمود الطلبة.
�س ّنف البيانات بح�سب الترتيب التنازلي.
ال�سكل :3.44اإن�ساء جمموعة البيانات
و�سوحا� ،ستختار وت�ستخدم فقط ال�سفوف اخلم�سة الأوىل من جمموعة البيانات اخلا�سة بك. لإن�ساء خمطط �سريطي اأكرث ً
ال�سكل :3.45حدد ال�سفوف اخلم�سة الأوىل من جمموعة البيانات
133
املقطع الربجمي لإن�ساء املخطط اخلا�ص بك. يمكنك ا�ستخدام هذا المقطع البرمجي ،لعر�س االأحرف العربية ب�سكل �سحيح.
اإحداثيات االأعمدة. �سع الت�سمية على المخطط.
ال�سكل :3.46اإن�ساء املخطط ال�سريطي
املخطط ال�سريطي اخلا�ص بك جاهز.
ال�سكل :3.47املخطط ال�سريطي
134
افرت�ص الآن اأنك تريد ر�س��م عدد الطلبة واملعلمني والإداريني على نف���ص املخطط ال�س��ريطي .ي�س��مى هذا املخطط باملخطط ال�س��ريطي املج ّمع وحتتاج اإىل و�سع ال�سرائط ب�سكل �سحيح اعتمادًا على عر�ص ال�سريط.
ال�سكل :3.48اإن�ساء املخطط ال�سريطيي املج ّمع
ال�سكل :3.49املخطط ال�سريطي املج ّمع
135
املخطط الدائري
Pie Chart
�سرتى خطوات اإن�ساء املخطط الدائري يف مفكرة جوبيرت. �ستن�س��ئ اإط��ار بيان��ات جدي��د ي�س��مى groupsPم��ن جمموع��ة البيان��ات الت��ي ا�س��تخدمتها يف الدر���ص ال�س��ابق .ق��م بتجمي��ع بيانات��ك ح�س��ب املرحل��ة واح�س��ل عل��ى املت��س��ط (() )meanللطلب��ة واملعلم��ني والإداري��ني ،ث��م ق��م بف��رز اإط��ار البيان��ات ه��ذا مبتو�س��ط عدد امل�س�وؤولني.
ال�سكل :3.50خمطط دائري
ال�سكل :3.51اإن�ساء اإطار بيانات جديد
الآن �ستن�س��ئ خمطط دائري يو�سح ن�س��بة الطلبة واملعلمني والإداريني ملنطقة واحدة .اأو ًل ،حتتاج اإىل اإن�س��اء قائمة حتتوي على �س��رائح املخطط الدائري. يف مثالك� ،ستكون ال�سرائح عبارة عن قائمة حتتوي على اأعداد الطلبة واملعلمني والإداريني للمنطقة يف ال�سف الأول.
الإظهار الن�سبة المئ�ية لكل �سريحة.
ال�سكل :3.52اإن�ساء خمطط دائري
خ�سائ�س لمظهر المخطط الدائري. 136
الآن �ستن�سئ �سكل يحتوي على اأكرث من خمطط دائري.
ال�سكل :3.53اإن�ساء اأربعة خمططات دائرية
حتت��وي مكتب��ة م��ات بل��وت لي��ب عل��ى جمموع��ة كب��رية م��ن االإع��دادات لت�سمي��م خمط��ط اأو ر�س��م بي��اين .ميكن��ك زي��ارة موق��ع املكتب��ة االإلك��رتوين http:\\matplotlib.orgواالط��الع عل��ى دلي��ل امل�س��تخدم للح�س��ول عل��ى تفا�سي��ل كاف��ة اإعدادته��ا.
137
ال�سكل :3.54املخطط الدائري
138
مترينات 1ناق�س اأهمية ت�س�ير البيانات كمرحلة يف التحليل اال�ستك�سايف للبيانات ،ثم ّ و�سح اأهميته مبثالن. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
2قارن بن اخل�سائ�س الرئي�س��ة للمخططات البيانية ّ اخلطية وال�س��ريطية ،ثم اذكر مثالن ملجم�عات البيانات واخرت املخطط املنا�سب لكل مثال. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
139
3حدد الفرق الرئي�سي بن املخطط النقطي واملخططات االأخرى ،ثم اذكر ً مثاال على ا�ستخدام املخطط النقطي. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
4ادرج مكتب��ات بايث���ن الت��ي حتتاجه��ا لتطبي��ق تقني��ات ت�س�ي��ر البيان��ات ،وم��ا ه��ي اخلط���ات لب��دء ا�س��تخدامها يف مفكرة ج�بيرت؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
5تريد معرفة عدد ال�سياح الذين يزورون اململكة العربية ال�سع�دية �سهر ًيا ملنطقة واحدة يف جمم�عة البيانات. ما ن�ع املخطط االأن�سب لال�ستخدام؟ (ادعم اإجابتك باأ�سباب منطقية). اخ��رت اأي منطق��ة م��ن جمم�ع��ة البيان��ات وا�س��تخدم مكتب��ة م��ات بل���ت لي��ب ،واأن�س��ئ ن���ع املخط��ط الذي تعتقد اأنه االأن�سب. بن��ا ًءا عل��ى املخط��ط ال��ذي اأن�س�اأته ،اكت�س��ف ال�س��هر ال��ذي ا�س��تقبلت في��ه املنطق��ة الت��ي اخرتته��ا اأك��ر ع��دد م��ن الزوار.
140
6تري��د مقارن��ة ع��دد ال�س��ياح الذي��ن ي��زورون اململك��ة العربي��ة ال�س��ع�دية م��ن 3اأج��زاء م��ن الع��امل ،اأوروب��ا واآ�س��يا وال�س��رق االأو�س��ط م��ن �س��هر اأكت�ب��ر اإىل يناي��ر. ما ن�ع املخطط االأن�سب لال�ستخدام ؟ (ادعم اإجابتك باأ�سباب منطقية). اأن�سئ ن�ع املخطط الذي تعتقد اأنه االأن�سب. بنا ًء على املخطط الذي اأن�س�اأته ،اكت�س��ف اأي جزء من العامل جاء منه معظم ال�س��ياح يف كل �س��هر من اأكت�بر اإىل يناير.
7تريد معرفة ال�سهر الذي ا�ستقطب معظم الزوار ثم معرفة الن�سبة املئ�ية لزوار كل منطقة لهذا ال�سهر. اأن�سئ اإطار بيانات لتحديد ال�سهر الذي ي�سم اأكر عدد من الزوار. اأي ن�ع من املخططات �سيك�ن االأن�سب يف هذه احلالة ؟ (ادعم اإجابتك باأ�سباب منطقية). اأن�سئ ن�ع املخطط الذي تعتقد اأنه االأن�سب. بن��ا ًء عل��ى املخط��ط ال��ذي اأن�س�اأته ،م��ا ه��ي املنطق��ة الت��ي لديه��ا اأعل��ى ن�س��بة م��ن ال��زوار واأي منه��ا لديه��ا اأق��ل ن�س��بة م��ن ال��زوار ؟
141
امل�سروع تري��د معرف��ة الطريق��ة الأك��رث تف�سي� ًال لل�س��ياح لزي��ارة اململك��ة العربي��ة ال�س��عودية .لدي��ك مل��ف اإك�س��ل بال�س��م " "tourist-indicators.xlsxوال��ذي يحت��وي عل��ى معلوم��ات ح��ول ع��دد ال�س��ياح الذي��ن ي�سل��ون اإىل اململك��ة العربي��ة ال�س��عودية ع��ن طريق اجلو والرب والبحر �س��هر ًيا.
142
1
افتح امللف "."tourist-indicators.xlsx
2
قم بتحميل ورقة العمل " "I7يف اإطار بيانات جديد با�ستخدام مكتبة باندا�ص.
3
اح�سر عدد ال�سياح الذين ي�سلون عن طريق اجلو والرب والبحر لكل �سهر.
4
قارن متو�سط عدد ال�سياح الذين ي�سلون اإىل اململكة العربية ال�سعودية عن طريق اجلو والرب لأ�سهر يناير وفرباير ومار�ص با�ستخدام تقنية الت�سوير املنا�سبة.
5
ما هي الن�سب املئوية لكل طريقة و�سول لالأ�سهر الثالثة مع اأقل عدد اإجمايل من الزوار ؟ لالإجابة على ال�سوؤال ،حتتاج اإىل اإن�ساء عمود جديد يف اإطار البيانات اخلا�ص بك مع اإجمايل عدد الزوار �سهر ًيا.
6
ما نوع املخطط الذي �س��يكون اأكرث فائدة لالإجابة على هذا ال�س�وؤال ؟ ادعم اإجابتك باأ�س��باب منطقية.
ماذا تعلمت
خطوات عملية حتليل البيانات. ا�ستخدام مفكرة جوبيرت كاأداة لتحليل البيانات. ا�ستخدام مكتبة باندا�س الإن�ساء االإح�ساءات. اأهمية ت�سوير البيانات. ا�ستخدام مكتبة مات بلوت ليب لتمثيل البيانات ب�سكل ر�سومي. اإن�ساء خمطط بياين �سريطي وخمطط دائري يف مفكرة جوبيرت.
الم�سطلحات الرئي�سة �سمة
تجميع
Grouping
فهر�سة
Indexing
تنظيف البيانات
وظيفة
Method
اإطار البيانات
متعدد المتغيرات تحليل غير ر�س�مي التحليل التنب�ؤي
Multivariate Non-Graphical Analysis Predictive Analysis
ت�س�ير البيانات التحليل ال��سفي التحليل الت�سخي�سي
Attribute Data Cleaning Data Frame Data Visualization Descriptive Analysis Diagnostic Analysis
التحليل الت�جيهي
Prescriptive Analysis
تحليل البيانات اال�ستك�سافي
مكتبة البرمجة
Programming Library
ت�سفية
Filtering
كائن المت�سل�سلة
Series Object
دالة
Function
اأحادي المتغير
Univariate
تحليل ر�س�مي
Exploratory Data Analysis
Graphical Analysis
143
.4منذجة البيانات ُّ والتوقع التنبوؤية ُّ والتوقع ،وي�سمل ذلك مفهوم �سيتعرف الطالب يف هذه الوحدة على مفهوم منذجة البيانات التنبوؤية ّ ُّ النمذج��ة التنبوؤي��ة ،واأمن��اط النماذج التنبوؤية وتطبيقاتها .وا ً التوقع، أي�سا� ،س��يتعلم الطالب مفهوم ُّ التوقع ،و�سيتم الرتكيز على مفهوم حت�سني احللول ،وذلك و�سرح وتو�سيح خطوات الو�سول اإىل نتائج من خالل �سياغة امل�سكلة واإيجاد احلل االأمثل لها من بني احللول املُ ْمكنة با�ستخدام اأداة اإك�سل �سولفر (.)Excel Solver ويف اخلتام� ،سيتع ّلم الطالب طريقة تقييم النتائج التي يح�سل عليها وذلك بهدف الو�سول اإىل اأف�سل النتائج والتو�سيات املتعلقة باالإجراءات اأو العمليات التي قد يتم تنفيذها يف امل�ستقبل.
بنهاية هذه الوحدة �سيكون الطالب قاد ًرا على اأن:
144
عرف م�سطلح النمذجة التنبوؤية. ُي ِّ وا�سحا لفئات النمذجة التنبوؤية. قدم و�س ًفا ُي ِّ ً حدد خطوات عملية النمذجة التنبوؤية. ُي ِّ ُيعدِّ د ميزات وعيوب النمذجة التنبوؤية. ُّ التوقع. عرف م�سطلح ُي ِّ ُيحدد اخلطوات املتبعة يف عمليات التنبوؤ. ُّ التوقع يف مايكرو�سوفت اإك�سل (.)Microsoft Excel ُين ِفّذ عملية ُي َع ِّرف مفهوم نطاق الثقة. ُّ للتوقع. ُي�س ِنّف املخططات اأوالر�سومات البيانية املتنوعة عرف مفهوم منوذج التح�سني. ُي ِّ ُيط ِّبق عملية التَّح�سني با�ستخدام اأداة اإك�سل �سولفر. حدد التو�سيات امل�ستقبلية. ُيق ِّيم نتائج عملية التح�سني و ُي ِّ
الدر�س االأول
منذجة البيانات التنبوؤية تلج�اأ املوؤ�س�س��ات وال�س��ركات ل�س��تخدام النمذج��ة التنبوؤي��ة لتحلي��ل الأح��داث امل�س��تقبلية املتعلق��ة بن�س��اطها التج��اري ،وذل��ك به��دَ ف اتخ��اذ اأف�س��ل الق��رارات. ُومي ِك��ن ا�س��تخدام من��اذج ال َتّنب�وؤ لفه��م ومعرف��ة �س��رائح وفئ��ات امل�س��تهلكني ،ولتقدير املبيعات املُحتمل��ة ،اأو لفهم ومعرفة الق�سايا الأمنية للح�س��ابات.
ما هي النمذجة التنبوؤية؟
?What is Predictive Modeling
فرع��ا م��ن ف��روع عل��م حتلي��ل البيان��ات املتق��دم ،وتَ�س��تعني ه��ذه التحلي��الت بالبيان��ات تُعت��رب التحلي��الت التنبوؤي��ة ً ُّ ال�سابقة ،اإىل جانب ُطرق اأخرى كالنمذجة الإح�سائية ،وتنقيب البيانات ،وتعلم الآلة ،وذلك لتقدمي التنبوؤات حول النتائج املُ�س��تقبلية لقرارات اأو لعمليات ُمعينة تقوم بها ال�س��ركات اأو املوؤ�س�س��ات .وت�س��تخدم ال�س��ركات واملوؤ�س�س��ات أمناط ُمعينة يف هذه البيانات ُمي ِكن من خاللها حتديد ال ُفر�ص واملخاطر .فعلى التحليالت التنبوؤية للتع ُّرف على ا ٍ ب�سكل يومي عن املتغريات املختلفة املتعلقة بحالة الطق�ص مثل �سبيل املثالَ ،تم ُع خدمة الأر�ساد اجلوية البيانات ٍ درجات احلرارة والرطوبة وغريها ،مما ُمي ِّك ُنها من التنبوؤ بحالة الطق�ص يف الأيام القادمة. تُ�س�تَخدم التحلي��الت التنبوؤي��ة عل��ى نط��اقٍ وا�س��ع يف جم��ال الرعاي��ة ال�سحية وذلك ِبهدف حت�س��ني ُطرق ت�س��خي�ص زمنة ،وت�ستخدم اإدارات املوارد الب�سرية وال�سركات مناذج التنبوؤ يف حت�سني أمرا�ص املُ ِ وعالج املر�سى امل�سابني بال ٍ ب�سكل وا�سع للك�سف عن عمليات الحتيال. عمليات اختيار وتعيني املوظفني ،واأما البنوك فت�ستخدمها ٍ
النمذجة التنب�ؤية
(:)Predictive Modeling َخدم ه��ي اأ�س� ٌ �لوب اإح�سائي تُ�س�ت ُ في��ه النتائ��ج والبيان��ات ال�س��ابقة للتنب �وؤ بالأح��داث اأو النتائ��ج امل�س��تقبلية.
مثال عندم��ا اأ�سب��ح فريو���س ك�رون��ا ( )COVID-19وب��ا ًء واأ�س��اب جمي��ع ال��دول يف اأنح��اء الع��امل ،اعتم��د خ��رباء ال�سح��ة يف كث��ري م��ن ال��دول عل��ى عل��م البيانات لنمذجة ال�سلوك الوبائي للمر�ص وللتنبوؤ مبعدلت العدوى والوفيات .ولقد اأ�سهمت النماذج التي مت تطويرها يف متكني اجلهات ال�سحية ماح انت�س��ار اجلائح��ة ،واحلدِّ من اآثارها املحتملة. والباحث��ني والعامل��ني يف املج��ال الطب��ي م��ن تطوي��ر طرقٍ ِ لكبح ِج ِ جامعات اأخرى -درا�س ًة تنبوؤية حول انت�سار فريو�س ك�رونا اأجرى باحثون يف جامعة امللك �سعود يف اململكة العربية ال�سعودية -وذلك بالتعاون مع ٍ ( )COVID-19يف اململكة ،وهَ دَ فت تلك الدِّ را�سة اإىل التو�سل اإىل فهم عميق لل�سلوك املتغري للعدوى با�ستخدام النماذج التنبوؤية واملحاكاة ،وا�ستعان مبعلومات عن انت�سار الوباء ،ولتقدمي التو ُّقعات املحتملة الباحثون ببيانات واح�سائيات دقيقة �سادرة من وزارة ال�سحة ال�سعودية لدعم مناذجهم ٍ حول اأعداد الإ�سابات .لقد �ساعد هذا التقدير يف اتخاذ القرارات املنا�سبة من ِق َب ِل احلكومة واجلهات امل�سوؤولة يف اململكة ،وذلك من خالل اتخاذ ري عظي ٌم يف التدابري الفعالة للمراقبة والوقاية ،وت�س َّمنت هذه التدابري فر�ص القيود على ال�سفر والتنقل واإغالق املدار�ص وامل�ساجد ،وكان لها تاأث ٌ تاأخري الو�سول لذروة تف�سي الوباء واحلدِّ من ُمع َّدلت الإ�سابة وانت�سار الوباء يف اململكة. ب�سكل اأ�سا�ص اإىل تو ُّفر البيانات احلقيقية ،التي �ساهمت يف تقدمي ويرجع ذلك ٍ لقد اأ�سبح القيام بعمليات النمذجة اأم ًرا مه ًما خالل تلك الفرتةِ ، مناذج التنبوؤ لنت�سار املر�ص من خالل مقارنة الأعداد املتو ّقعة لالإ�ساب��ات بالع��دد الفعل��ي له��ا .اأ�سبح عدد احلالت املكت�س��فة حدي ًث��ا يتناق���ص م��ع دخ��ول الإج��راءات املختلف��ة مث��ل الإغ��الق وقيود ال�س��فر ح ِّيز التنفيذ ،وكان يف ذلك دلي ٌل وا�س ٌح على اأن تنبوؤات الباحثني كانت قريب ًة جدً ا مما حدث ً فعال ،كما يظهر يف ال�س��كل ،4.1حي��ث تُظه��ر العم��دة يف ال�س��كل املعلوم��ات الرتا ُكمية حول الأعداد احلقيقية لالإ�سابة ،بينما ُي ِظهر اخلط الأحمر تو ُّقعات عدد الإ�سابات ،و َي ِعر�ص املخطط البياين ا ً أي�سا التواريخ التي مت فيها فر�ص القيود املختلفة. �سكل :4.1تقييم النموذج التنبوؤي مع العدد الفعلي والعدد املُتو ُّقع حلالت الإ�سابة امل�سجلة يوم ًيا 145
فئات النمذجة التنبوؤية
Predictive Modeling Categories
تتمثل مُهِ مة املُتع ِّلم يف النمذجة التنبوؤية بالو�سول اإىل الدالة اأو العالقة الوظيفية التي تر ِبط متغريات الإدخال باملخرجات (التنبوؤات) يف بيانات عامالت تلك الدالة. التدريب ( ،)Training Dataوذلك ِب�سرف النظر عن طبيعة و ُم ِ مبج��رد الو�س��ول اإىل ه��ذه العالق��ة الوظيفي��ةُ ،ميك��ن ا�س��تخدامها للتنب�وؤ ِب ِق َي� ِ�م املُخرج��ات بن��ا ًء عل��ى متغ��ريات الإدخ��ال املختلف��ة .وت�سنف النم��اذج التنبوؤية عامالت، عامالت وت�سمى بالنم�ذج املُعامِ لي ( ،)Parametric Modelوفئة ل حتتوي على عدد حمدد من املُ ِ اإىل فئتني :فئة حتتوي على عدد حمدد من املُ ِ ويطلق عليها ت�سمية النم�ذج غري املُعامِ لي (.)Non-Parametric Model
.1النماذج املُعا ِملية
Parametric Models
تعت��رب الفرتا�س��ات ج��ز ًءا اأ�سا�س� ًيا م��ن اأي من��وذج م��ن من��اذج البيان��ات ،فه��ي عاملي افرتا�سات ُحت ِّ�سن التنبوؤات وتعل النموذج اأ�سهل للفهمَ .ي�س ُع النموذج املُ َ حمددة حول �سكل الدالة التي �سيتم تعيينها ،ويفرت�ص جمموعة حمددة ُم�سب ًقا ب�سكل م�ستقل عن تلك املوجودة يف اأمثلة التدريب ،وهكذا من املُ ِ عامالت ،وذلك ٍ عاملي يقوم بتلخي�ص بيانات التدريب من خالل هذه املجموعة فاإن النموذج املُ ِ عامالت. من املُ ِ
.2النماذج غري املُعا ِملية
Non-Parametric Models
عاملية لي�س��ت َمعن َّية بتكوين الفرتا�سات حول دالة اإن مناذج تَعلُّم الآلة غري املُ ِ التعين ( ،)Mapping Functionفيمكن ملثل هذه النماذج ً مثال تقدير طبيعة العالق��ة الوظيفي��ة م��ن خالل بيان��ات التدريب.وتُع ُّد هذه النماذج خيا ًرا ممتا ًزا لتحليل الكميات الكبرية من البيانات بدون اأي معرفة �سابقة عنها.
املُعامِ ل (:)Parameter عام��ل باأن��ه متغ��ري ميك��ن و�س��ف املُ ِ جوهري واأ�سا�سي يف تكوين النموذج.
يعتمد املتخ�س�سون يف عمل حتليالت النماذج التنبوؤية على البيانات من امل�سادر التالية: بيانات عملياتية (.)Transactional Data بيانات العمالء (.)Customer Data البيانات الطبية (.)Medical Data البيانات املالية (.)Financial Data املعل�مات الدمي�غرافية (.)Demographic Data البيانات اجلغرافية (.)Geographic Data بيانات الت�س�يق الرقمي ( .)Digital Marketing Data اإح�سائيات ال�يب (.)Web Traffic Statistics
اجلدول :4.1مقارنة بني النماذج املُعا ِملية وغري املُعا ِملية املعيار
146
النماذج املُعامِلية
النماذج غري املُعامِلية
بيانات التدريب
تتطل��ب بيان��ات تدري��ب اأق��ل م��ن النم��اذج غ��ري تتطل��ب بيان��ات اأك��ر بكث��ري م��ن النم��اذج املُعامِ لي��ة لتقدي��ر العالق��ة اأو دال��ة التعي��ن. ا ملُعامِ لي��ة.
�سرعة التدريب
وميكن تدريبها ت�س��تغرق وق ًت��ا اأط���ل للتدري��ب ،حي��ث تت�سم��ن حتلي��ل عالق��ات اأك��ر اأ�س��رع اإجنا ًزا من الناحية احل�س��ابيةُ ، تعقي�دًا يت��م تقديره��ا اأثن��اء عملي��ة التدري��ب. ب�سكل اأ�سرع ل�ج�د مُعامِ الت حمدودة للتدريب.
املالءمة
ق��د ال ُتق �دِّم ه��ذه النم��اذج اأف�س��ل مالءم��ة للبيان��اتُ ،ت� ِّف��ر ه��ذه النم��اذج تنب��ؤات اأك��ر دق��ة م��ن النم��اذج املُعامِ لي��ة م��ن حي��ث مالءمة البيانات ،ولكن اخل�ارزميات يف هذه النماذج تك�ن اأكر عر�سة وم��ن امل�س��تبعد اأن تتطاب��ق متا ًم��ا م��ع دال��ة التعين. مل�سكلة فرط التخ�سي�س (.)Overfitting
التعقيد
اإجراءا ُته��ا اأك��ر تعقي�دًا و�سع�ب��ة �س���اء م��ن ناحي��ة اإمكاني��ة التف�س��ري اأو الفهم.
تتميز اإجراءا ُتها ب�سه�لة فهمها وتف�سريها.
مهام النمذجة التنبوؤية
Predictive Modeling Tasks
ا�ستخداما يف مهام النمذجة التنبوؤية. تُع ُّد مناذج الت�سنيف ( )Classificationواالنحدار ( )Regressionمن اأهم واأكرث النماذج ً
.1الت�سنيف
Classification
يعتم��د من��وذج الت�سني��ف عل��ى عملي��ة تقيي��م املتغ��ريات املُدخل��ة ث��م ت�سنيفه��ا �سمن جمموعات لتكوين بيانات املُخرجات ،وبذلك فاإن املتغري الذي �سيتم تو ُّقعه �ستكون له قي ًما ّ متقطعة ( ،)Discreteوقد تكون هذه القيم بب�ساطة جمرد اإجابة ل�س�وؤال مع��ني ب � "نع��م" اأو "ل" .و ُي�س��تخدم من��وذج الت�سني��ف يف تقيي��م عمليات التموي��ل والبي��ع بالتجزئ��ة ،حي��ث مبقدوره جمع املعلومات ب�س��رعة وت�سنيفها يف جمموعات لتقدمي الإجابات عن الأ�سئلة املتعلقة بتلك العمليات. .2االنحدار Regression
يعتم��د من��وذج النح��دار عل��ى مب��داأ اإيج��اد عالق��ات ريا�سي��ة ترب��ط ب��ني متغريي��ن ،بحي��ث ُميك��ن تنب �وؤ اأحدهم��ا م��ن خ��الل معرف��ة املتغ��ري الآخ��ر ،و ُيطل��ق عل��ى املتغ��ري املُدخ��ل ا�س��م املتغ��ري امل�س��تقل ( ،)Independent Variableبينم��ا ُيطل��ق عل��ى املتغ��ري املُخ��رج ا�س��م املتغ��ري التاب��ع ( ،)Dependent Variableويتنب �اأ ه��ذا النم��وذج بالقي��م املحتمل��ة للمتغ��ريات التابع��ة م��ن خ��الل معاجل��ة ِقي��م املتغ��ريات امل�س��تقلة .يت��م متثيل هذا خط م�ستقيم (انحدار خطي) يتقارب مع جميع نقاط النموذج بيان ًيا يف �سورة ٍ البيانات امل�س��تقلة .وميكن لنموذج النحدار على �س��بيل املثال التنبوؤ مبدة بقاء �س��خ�ص اإب��ان دخ��ول امل�ست�س��فى ،وميث��ل ع��دد الأيام يف امل�ست�س��فى املتغري التابع، اأم��ا مع��دل النب���ص لذل��ك ال�س��خ�ص ً مثال فيمثل املتغري امل�س��تقل.
�سكل :4.2يو�سح الفرق بني الت�سنيف (ال�سكل العلوي) والنحدار (ال�سكل ال�سفلي) ،حيث مي ّثل الت�سنيف اخلط املُنقط وهو احلد اخلطي الفا�سل بني فئتني خمتلفتني ،بينما ُميثل اخلط املُنقط يف النحدار العالقة اخلطية بني متغريين.
اجلدول :4.2مقارنة بني الت�سنيف واالنحدار الت�سنيف
االنحدار
الت�سني��ف ه��� التنب��ؤ باملُخرج��ات لفئ��ة متقطع��ة مبعن��ى اأن االنحدار ه� التنب�ؤ بناجت كمي م�ستمر مبعنى اأن املتغري املُخرج يجب اأن يك�ن قيمة م�ستمرة اأو عددًا حقيق ًيا. �سحيحا. املتغري املُخرج يجب اأن يك�ن عددًا ً
ُت�س��تخدم خ�ارزمي��ة الت�سني��ف لتعي��ن قيم��ة املُدخ��ل ُت�س��تخدم خ�ارزمي��ة االنح��دار لتعي��ن قيم��ة املُدخ��ل ( )xم��ع املتغ��ري ( )xمع املتغري املُخرج ذو القيم ّ املتقطعة (.)y املُخرج ذو القيم امل�ستمرة (.)y
147
من املهام ال�سائعة الأخرى للنمذجة التنبوؤية:
ُّ التوقع .3
Forecasting
وه��و اإج��راء وتق��دمي تقدي��رات رقمي��ة معين��ة بن��ا ًء عل��ى حتلي��ل البيانات ال�س��ابقة والتي يطلق عليها البيانات التاريخية .وتَ�س��تخدم �س��ركات �سيوعا حيث ال�ستثمار التو ُّقعات للتنبوؤ باأ�سعار الأ�سهم يف التداولت اليومية اأو طويلة الأجل ،ويعترب منوذج التو ُّقع من اأكرث مناذج التنبوؤ ً يتميز بامكانيات ا�ستخدام كثرية يف العديد من املجالت.
.4التجميع
Clustering
ُي�س ِّن��ف من��وذج التجمي��ع البيان��ات اإىل جمموع��ات بن��ا ًء عل��ى اخل�سائ���ص املت�س��ابهة بينه��ا، ثم ي�ستخدم بيانات كل جمم�عة ( )Clusterلتحديد النتائج على نطاق وا�سع لكل جمموعة. وهن��اك نوع��ان م��ن ط��رق التجمي��ع يت��م ا�س��تخدامهما يف ه��ذا النم��وذج :التجمي��ع ال�سل��ب ( )Hard Clusteringيعتم��د عل��ى ت�سني��ف البيان��ات اإىل جمموع��ات متمي��زة ،حي��ث ميك��ن اأن تنتم��ي كل نقط��ة بيان��ات اإىل جمموع��ة واح��دة فق��ط ،والتجمي��ع الناع��م ()Soft Clustering يعتم��د عل��ى تعي��ني احتم��الت ل��كل نقط��ة بيان��ات ،حي��ث ميك��ن اأن تنتم��ي نق��اط البيان��ات اإىل اأكرث من جمموعة واحدةُ .وميكن لل�سركات ا�ستخدام منوذج التجميع لتحديد ا�سرتاتيجيات الت�س��ويق لفئات معينة من امل�س��تهلكني.
.5منوذج اكت�ساف القيم ال�ساذة
Outlier Detection
�سكل :4.3مثال على التجميع لأربع جمموعات بناء على قيمتي الدخل ومعدل الإنفاق
يطل��ق م�سطل��ح القي��م ال�س��اذة عل��ى قي��م البيان��ات غ��ري املتجان�س��ة اأو تل��ك املنف�سل��ة ع��ن بقية البيانات يف جمموعة البيانات ،وميكن لنماذج اكت�ساف القيم ال�ساذة فح�ص وحتديد القيم الغريب��ة وغ��ري العادي��ة يف البيان��ات ،وتقيي��م مدى ارتباطها بفئات اأو اأرقام اأخرى.
.6ال�سال�سل الزمنية
Time Series
�تخدم من��اذج ال�سال�س��ل الزمني��ة ِقي� َ�م البيان��ات املتوف��رة �س��اب ًقا �سم��ن ت�سل�س��ل زمن��ي ُحم��دد كعوام��ل الإدخ��ال يف جمموع��ة البيان��ات؛ تَ�س� ِ أحداث فريدة اأو بقيم جديدة اأو اأحداث م�ستقبلية ،وميكن لهذه النماذج تقدمي التو ُّقعات امل�ستقبلية لتاهات اأو ا ٍ وذلك من اأجل التنبوؤ ٍ متعددة .ميكن لنماذج ال�سال�سل الزمنية ا ً أي�سا حتليل تاأثري العوامل اخلارجية كتلك املو�سمية والعار�سة (غري املتو ّقعة) التي قد حتدث على القيم والتاهات امل�ستقبلية ،على �سبيل املثال ميكن ل�سركة �سناعات اإلكرتونية ا�ستخدام منوذج ال�سال�سل الزمنية لتحليل الوقت املطلوب ملعاجلة الطلبيات على مدار العام املا�سي ،وبالتايل ميكن للنموذج التنبوؤ مبتو�س��ط وقت املعاجلة ال�س��هري. تُ�ستخدم طرق اأخرى للنمذجة التنبوؤية يف امل�سائل الأكرث تعقيدً ا. ِمن ُطرق النمذجة التنبوؤية: اأ�سجار القرار (.)Decision Trees التعزيز اال�ستقاقي (.)Gradient Boosting النماذج اخلطية العامة (.)General linear Models ال�سبكات الع�سبية (.)Neural Networks مناذج بروفيت (.)Prophet Models 148
عملية النمذجة التنبوؤية
The Predictive Modeling Process
ميك��ن تعري��ف النمذج��ة التنبوؤي��ة بب�س��اطة عل��ى اأنه��ا عملي��ة تنفي��ذ خوارزمي��ات عل��ى جمموع��ات م��ن البيان��ات لإن�س��اء التنبوؤات ،ويت��م يف هذه العملية اإن�س��اء من��وذج وتدريب��ه ،ث��م التحق��ق م��ن ِ�سحت��ه واإدخ��ال التح�س��ينات علي��ه عند احلاجة ،للح�سول على املعلومات املنا�س��بة التي تُلبي احتياجات املوؤ�س�س��ة .وتتكون اخلطوات الأ�سا�س��ية لإجراء النمذجة التنبوؤية ب�س��كل منوذجي من:
.1جمع البيانات وتنظيفها
Data collection and cleaning
اإن م��ن امله��م القي��ام بجم��ع البيان��ات م��ن جمي��ع امل�س��ادر املتوف��رة به��دف ا�س��تخراج املعلوم��ات الالزم��ة لعملي��ة النمذج��ة ،وبع��د ذل��ك تت��م عملي��ة تنظيفه��ا م��ن ال�س��وائب والقي��م ال�س��اذة للح�س��ول عل��ى تقدي��رات دقيق��ة .وتُط َّب��ق ه��ذه اخلط��وة عل��ى :البيانات املختلف��ة مثل عمليات البيع وال�س��راء �كل اآيل ع��رب الويب وال�س��تبانات اخلا�س��ة بالعم��الء ،والبيان��ات الإح�سائي��ة اخلا�س��ة بالقت�س��اد وامل�س��ح ال�س��كاين ،والبيان��ات الت��ي يت��م جمعه��ا ب�س� ٍ وم��ن خ��الل الأجه��زة املختلف��ة وغري ذلك.
.2حتويل البيانات
Data transformation
تت��م عملي��ة حتوي��ل البيان��ات بتوحي��د ُبني��ة و�سياغ��ة البيان��ات با�س��تخدام عملي��ات معاجل��ة دقيق��ة للح�س��ول عل��ى البيان��ات يف �سورته��ا النهائي��ة ،وت�س��مل ه��ذه العملي��ة حتدي��د نطاق��ات معين��ة لقي��م البيان��ات واإزال��ة القي��م الغريب��ة والبيان��ات ال�س��اذة م��ن خ��الل حتلي��ل االرتب��اط (.)Correlation Analysis
� .3سياغة النموذج التنبوؤي
Formulation of the Predictive Model
تت�سم��ن عملي��ة �سياغ��ة النم��وذج التنب�وؤي القي��ام بتحدي��د ط��رق التنب�وؤ املنا�س��بة ح�س��ب احلاج��ة ،فيمك��ن مث� ً�ال ا�س��تخدام �س��جرة الق��رار يف عملي��ة الت�سني��ف ،بينم��ا يج��ب ا�س��تخدام من��وذج التعزي��ز ال�س��تقاقي ح��ني تك��ون املهم��ة تتعل��ق بالنحدار .ويتم اأثن��اء هذه العملية حتدي��د بيانات التدريب والختبار يف النموذج ،حيث يتم تدريب خوارزمية الإجراء املحدد با�ستخدام بيانات التدريب املتاحة ،ثم يتم تطبيق النموذج الناجت على البيانات لختباره��ا وحتديد اأداء النموذج.
.4اال�ستنتاجات اأو اال�ستدالالت
Inferences or conclusions
يف النهاية يتم ا�ستخراج ال�ستدللت وا�ستخال�ص ال�ستنتاجات من النموذج ،والتي تُ�ساعد يف الإجابة على اأ�سئلة الأعمال.
اال�ستدالالت اأو اال�ستنتاجات
جمع البيانات وتنظيفها
حتويل البيانات
�سياغة النموذج التنبوؤي �سكل :4.4خمطط عملية النمذجة التنبوؤية
149
مثال عملي على الت�سنيف
Practical Classification Example
م�سروع مهمته ت َف ُّقد هياكل املباين اخلر�سانية يعر�ص هذا املثال كيفية اإن�ساء منوذج تنبوؤي يف اإطار علم البيانات .افرت�ص اأنك تعمل �سمن فريق ٍ وب�سكل خا�ص يف املباين املرتفعة ،فيمكنك وفح�سها بح ًثا عن ال�سقوق املوجودة فيها ،ولأن هذه العملية تتميز بال�سعوبة واخلطورة امل�ساحبة لها، ٍ اإن�ساء من�ذج َتع ُّلم االآلة ( )Machine Learning Modelالذي مبقدوره فح�ص �سور اخلر�سانة يف هياكل املباين ،ثم ت�سنيفها اإىل ِفئ ٍة اإيجابية يف حال وجود ال�س��قوق بها ،واأخرى �س��لبية اإذا َخ ْلت من ال�س��قوق .ميكن بعد ذلك دمج ال�سور التي ميكن التقاطها بوا�س��طة طائرة م�س��رية بدون يتيح اإجراء فح�ص املباين بطريقة اأكرث اأما ًنا وفاعلية. طيار مع النموذج مما ُ تتطل��ب عملي��ة تدري��ب النم��وذج وج��ود البيان��ات ،والت��ي �ستنق�س��م يف ه��ذه احلالة اإىل فئتني :تتَ�سمن الفئة الأوىل �سو ًرا للخر�س��انة التي حتتوي على ال�سقوق ،بينما تت�سمن الأخرى �سو ًرا خلر�سانة �سليم ٍة خالية من ال�سقوق. يجب ا ً أي�سا تق�سيم جمموعة بيانات ال�سور اإىل جمموعتي بيانات منف�سلتني: جمم�عة التدريب ( )Training Datasetوتت�سمن ال�سور التي �ست�ستخدمها لتدريب منوذج تعلُّم الآلة. جمم�عة االختبار ( )Test Datasetوتت�سمن �سو ًرا جديدة مل تكن �سمن جمموعة بيانات تدريب النموذج ويهدف ا�ستخدام هذه ال�سور اإىل اختبار اأداء النموذج وتقييمه. يجب اأن حتتوي جمموعة التدريب وجمموعة الختبار على �سو ٍر لكلتا الفئتني من الهياكل اخلر�سانية :الفئة الإيجابية (التي حتتوي على ال�سقوق) اأو من الفئة ال�سلبية (التي تخلو من ال�سقوق). لتدري��ب من��وذج عل��ى ت�سني��ف �س��ور اخلر�س��انة ،ميكن��ك ا�س��تخدام برنامج اآل��ة قابلة للتعليم ( )Teachable Machineع��رب الإنرتنت ،وهي ُمتاحة على املوقع الإلكرتوين ،https://teachablemachine.withgoogle.com :و�ستقوم بتحميل ال�سور من جملد ال�سور يف حا�سوبك لت�سنيفها. الإن�ساء منوذج وتدريبه:
150
افتح املُت�سفح وانتقل اإىل املوقع الإلكرتوين.https://teachablemachine.withgoogle.com : ا�سغط على ( Get Startedالبدء)2 . ا�سغط على ( Image Projectم�سروع ال�سورة)3 . (منوذج ال�سورة القيا�سي)4 . ا�سغط على َ Standard Image Model اأعد ت�سمية ( Class 1الفئة )1اإىل ( Positiveاإيجابي) و ( Class 2الفئة )2اإىل �( Negativeسلبي)5 . (حتميل) يف الفئة الإيجابية6 . ا�سغط على َ Upload ا�سغ��ط عل��ى ( Choose images from your files, or drag & drop hereاختي��ار ال�س��ور م��ن ملفات��ك اأو ا�س��حبها واأفلته��ا هن��ا) 7 ،لتحدي��د وحتمي��ل جمموع��ة ال�س��ور التدريبي��ة الت��ي به��ا �س��قوق يف اخلر�س��انة م��ن املجل��د الفرع��ي اإيجاب��ي ( )Positiveيف جمل��د �س���ر الت�سني��ف ( )Images for classificationاملوج��ود داخ��ل امل�س��تندات (.)Documents َك ِّرر العملية لتحديد وحتميل جمموعة ال�سور التدريبية التي ل حتتوي على �سقوق يف اخلر�سانة من املجلد الفرعي �سلبي ( )Negativeيف جملد �س�ر الت�سنيف ( )Images for classificationداخل امل�ستندات (8 .)Documents ا�سغط على ( Train Modelتدريب النموذج)9 . 1
1
2
3 151
4
Class 1
5
6
Class 2
152
7
8
9
�سكل :4.5اإن�ساء منوذج وتدريبه
ميكن��ك اختب��ار النم��وذج عن��د النته��اء م��ن عملي��ة التدري��ب م��ن خ��الل تق��دمي �س��ورة من بيان��ات الختبار ،وذلك اإما م��ن الفئة الإيجابي��ة (التي حتتوي على ال�س��قوق) اأو من الفئة ال�س��لبية (التي تخلو من ال�س��قوق) ،ثم ميكنك تقييم املخرجات. 153
الختبار وتقييم منوذج: ح��دِّ د �س��ورة به��ا �س��قوق يف اخلر�س��انة م��ن املجل��د الفرع��ي اختب��ار ( )Testاملوج��ود يف جمل��د �س���ر الت�سني��ف م بتحميلها1 . ( )Images for classificationداخل امل�ستندات ( )Documentsو ُق ْ ا�سغ��ط عل��ى ( Choose images from your files, or drag & drop hereاختي��ار ال�س��ور م��ن ملفات��ك اأو ا�س��حبها واأفلته��ا هنا)2 .
1
2
�سكل :4.6اختبار وتقييم منوذج
كم��ا تالح��ظ ،فق��د َ�س َّن��ف النم��وذج ال�س��ورة ب�س��كل �سحي��ح يف الفئ��ة الإيجابي��ة م��ع ن�س��بة يق��ني ،100 %وذل��ك متو ّق��ع؛ لأن �س��ورة اخلر�س��انة الت��ي قم��ت بتحميله��ا حتت��وي عل��ى ال�س��قوق .وعلي��ك تك��رار اخلطوت��ني الأخريت��ني لتحمي��ل �س��ورة خمتلف��ة وتقيي��م النموذج م��رة اأخرى. 154
ميزات وحتديات النمذجة التنبوؤية
Benefits and Limitations of Predictive Modeling
ميزات النمذجة التنبوؤية:
حتديات النمذجة التنبوؤية:
حت�سن اإ�سرتاتيجيات الت�س�يق واملبيعات وخدمة العمالء.
اأمن وخ�س��سية البيانات.
حت�سن التناف�سية املبنية على املعرفة وت�ظيف االإ�سرتاتيجيات الكت�ساب ميزة املناف�سة.
التعامل مع حجم كبري من البيانات.
تعزيز ج�دة املنتجات واخلدمات.
حتديات اإدارة البيانات.
التحليل الدقيق ملتطلبات امل�ستهلك. ت�فري الت� ُّقعات للع�امل اخلارجية التي ت�ؤثر على االإنتاجية اأو �سري العمل.
احلاجة امل�ستمرة لتكييف النماذج مع الق�سايا وامل�ساكل امل�ستجدة.
امل�ساهمة يف اإدارة املخاطر املالية واال�ستثمارية. ت�فري التنب�ؤ بامل�ارد اأو باملخزون من امل�اد املختلفة. التنب�ؤ بالت�جهات امل�ستقبلية لالأعمال. دعم عملية اإدارة الق�ى العاملة وحتليل امل�ساكل املتعلقة بها.
اأدوات النمذجة التنبوؤية
Predictive Modeling tools
توج��د اأدوات النمذج��ة التنبوؤي��ة احلديث��ة عل��ى �س��ورة َمن�س��ات متكامل��ة تدع��م تطوي��ر اخلوارزمي��ات وحتلي��ل البيان��ات وتق��دمي النتائ��ج املوثوق��ة ،و َيت � ُّم ا�س��تخدام ه��ذه الأدوات م��ن ِق َب� ْ�ل ال�س��ركات واملوؤ�س�س��ات البحثي��ة لإخ��راج ا�س��تنتاجات دقيق��ة و�س��املة ميكنه��ا امل�س��اهمة يف اتخ��اذ الق��رارات الفعال��ة. االأدوات املتاحة:
�سكل :4.7خمطط حتليل البيانات وحتويلها
من�سة H2Oللذكاء اال�سطناعي (.)H2O Driverless AI من�سة IBMوات�س�ن �ست�دي� (.)IBM Watson Studio من�سة رابيد مايرن �ست�دي� (.)RapidMiner Studio من�سة �ساب للتحليالت ال�سحابية (.)SAP Analytics Cloud من�سة �سا�س (.)SAS من�سة IBMاحلزمة االإح�سائية للعل�م االجتماعية (.)IBM SPSS من�سة اأوراكل لعلم البيانات (.)Oracle Data Science 155
جدول :4.3تطبيقات النمذجة التنبوؤية
156
التطبيق
الو�سف
املبيعات
ميك��ن اأن ي�س��اهم التحلي��ل التنب��ؤي يف حتدي��د مكان��ة ال�س��ركة املالي��ة م��ن حي��ث املبيع��ات واالأرب��اح، فمِ ن خالل الك�س��ف عن احلاالت ال�س��اذة والتباين يف البيانات املالية ال�س��ابقة لالأق�س��ام املختلفة يف ال�سركة ،ميكن للنمذجة حتديد االأق�سام ذات االأداء املنخف�س مثل ق�سم املبيعات ،وهذا ي�ؤدي اإىل حت�سن اأداء ال�سركة واإدخال التح�سينات على االأق�سام اأو العمليات مبا يتنا�سب مع اإ�سرتاتيجيات النم��� واالأداء املتميز.
الت�سويق
ميك��ن لل�س��ركات ا�س��تهداف فئ��ات معين��ة م��ن العم��الء باحلم��الت الرتويجي��ة ملنتج��اتٍ اأو خدم��اتٍ معينة ،وذلك من خالل التحليل والتنب�ؤ ا�ستنادًا اإىل البيانات ال�سابقة ،كما ميكن لها ا ً أي�سا ت� ُّقع ا�س��تجابات ومتطلبات ه�ؤالء العمالء ،وهنا يك ُمن اأحد االأ�س��باب الرئي�س��ة يف قيام ال�س��ركات بجمع البيانات ال�سابقةُ .تعدُّ معرفة رغبات العمالء والتنب�ؤ باملنتجات واخلدمات التي يرغب�ن باحل�س�ل عليها يف امل�ستقبل من اأهم اإ�سرتاتيجيات الت�س�يق احلديثة.
و�سائل التوا�سل االجتماعي
ُتعدُّ و�سائل الت�ا�سل االجتماعي م�سد ًرا اأ�سا�س ًيا للبيانات ال�سخمة غري َّ املنظمة وغري املتجان�سة، والتي تتك َّ�ن من م�ساركة مالين االأ�سخا�س ي�م ًيا يف احلديث عن الق�سايا وامل�ا�سيع املختلفة، للنمذجة التنب�ؤية ،حيث يَ�سم ُح للم�ؤ�س�سات ويُعدُّ حتليل بياناتها من اأكر التطبيقات ا�ستخدامًا َ وال�سركات با�ستك�ساف اهتمامات العمالء وبالتايل تط�ير خططها امل�ستقبلية وفقًا لذلك.
تقييم املخاطر
ُت�س��تخدم النمذج��ة عل��ى نط��اق وا�س��ع يف امل�ؤ�س�س��ات املالي��ة لتقيي��م املخاط��ر املتعلق��ة بتم�ي��ل االأف��راد وميكن واالأعمال ،حيث ت�س��اهم ب�س��كل فعال يف تقييم اأهليتهم للتم�يل ويف الك�س��ف عن االحتيالُ ، الأدوات التحليل التنب�ؤية ا ً أي�سا م�ساعدة امل�ؤ�س�سات يف اإجراء تقييم ملخاطر اال�ستثمار وحتديد درجة املخاطرة اأو العائد امل�ستقبلي على اال�ستثمار.
حت�سني اجلودة
ُت�ستخدم النمذجة يف عملية حت�سن اجل�دة من خالل اال�ستعانة مبالحظات العمالء ح�ل منتج اأو خدمة معينة لتح�سن ج�دتها ،وكذلك للتنب�ؤ باالأثر املت� ّقع للتغيريات يف املنتجات اأو اخلدمات من حيث زيادة املبيعات اأو اإقبال الزبائن على �سرائها.
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي:
�سحيحة
خاطئة
.1تَ�س��تخدم ال�س��ركات التحلي��الت التنبوؤي��ة ِللعث��ور عل��ى اأمن��اط معين��ة يف هذه البيانات ت�س��اعد يف التعرف على املخاطر وال ُفر�ص املتاحة التي تتعلق بعمليات تلك ال�سركات. �كل مب�س��ط كلما ارتفعت دقة التحليالت املراد .2يزداد تعقيد النماذج وي�سبح من ال�سعب تف�س��ريها ب�س� ٍ احل�سول عليها. .3تُع ُّد البيانات ذات الطبيعة املعقدة ،كتلك املتعلقة بال�سلوك الب�سري اأحد اأ�سباب ف�سل النموذج. ُ .4يع� ُّد احل�س��ول عل��ى بيان��ات ذات عالق��ة بالنم��وذج التنب�وؤي م��ن اأول املتطلب��ات لنج��اح ذل��ك النم��وذج وعمل��ه ب�س��كل فاعل. ُ .5يع ُّد تقييم املخاطر املالية من اأهم ا�ستخدامات التحليل التنبوؤي. .6ل ُميكن لنموذج التنبوؤ التعامل مع اأكرث من متغري واحد يف نف�ص الوقت. عامالت الحتيالية واحلركات امل�سبوهة. .7تُ�ستخدم مناذج القيم ال�ساذة لكت�ساف املُ َ ُ .8ميك��ن لنم��وذج ال�سال�س��ل الزمني��ة حتلي��ل العوامل اخلارجية املو�س��مية اأو العار�س��ة التي ميكنها اأن توؤثر على التاهات امل�ستقبلية. عامل باأنه متغري جوهري يف النموذج. ُ .9ميكن و�سف املُ ِ أحداث معينة من خالل ا�ستخدام قيم البيانات .10تُ�ستخدم مناذج التنبوؤ لتقدمي التو ُّقعات امل�ستقبلية ل ٍ ت�سل�سل زمني حمدد كعوامل الإدخال يف جمموعة البيانات. ال�سابقة املتوفرة ،وذلك ِ�سمن ٍ
157
أعط ً مثاال عليها. 2ا�سرح باإيجاز مفه�م النمذجة التنب�ؤية ُم�ستعي ًنا بالبحث على االإنرتنت وا ِ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
3ا�سرح باإيجاز خط�ات البدء باإن�ساء من�ذج تنب�ؤي. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
� 4سف بع�س التطبيقات العملية للنمذجة التنب�ؤية يف واقعنا الي�مي. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
158
5مت تكليف��ك باإن�س��اء من���ذج تنب ��ؤي حل���ادث امل��رور يف اململك��ة ،وبالطب��ع ف �اإن علي��ك ا ً أوال حتدي��د البيان��ات الت��ي حتتاجه��ا له��ذا النم���ذج .ابح��ث يف الب�اب��ة ال�طني��ة للبيان��ات املفت�ح��ة ع��ر ال�ي��ب ( )https://data.gov.saعن البيانات املنا�سبة ،ثم حدِّد ن�ع هذه البيانات وعدد �سن�ات البيانات التي �ستحتاجها. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
6مت تكليف��ك باإن�س��اء من���ذج تنب��ؤي لت�سني��ف جمم�ع��ة م��ن ال�س���ر ل��س��ائل امل�ا�س��الت املختلف��ة ،والت��ي ت�س��مل ال�س��يارات والطائ��رات وال�س��فنِّ . و�س��ح اخلط���ات الت��ي �س��تق�م به��ا الإن�س��اء ه��ذا النم���ذجِ ،ب��دءاً م��ن عملي��ة جم��ع البيان��ات حت��ى عملي��ة تدري��ب النم���ذج. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
7ابح��ث عل��ى االإنرتن��ت ع��ن اأمثل��ة ح���ل املخ��اوف االأخالقي��ة املتعلق��ة باخل�س��سي��ة ،والت��ي ق��د ُتع َزى اإىل ا�س��تخدام النمذج��ة التنب�ؤي��ة .عل��ى �س��بيل املث��ال ،ه��ل يح��ق لل�س��ركات م��ن الناحي��ة االأخالقي��ة تعين وترقي��ة امل�ظفن وف ًقا لنم��اذج التنب��ؤ الت��ي تعتم��د عل��ى البيان��ات ال�سحي��ة الأولئك امل�ظفن؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
159
الدر�س الثاين
ُّ التوقع
()Forecasting
التَو ُّق��ع ه��و تقدي��ر لالأح��داث املُ�س��تقبلية يت��م اإج��راوؤه بت�سم��ني وحتلي��ل البيان��ات ال�س��ابقة بطريق��ة َمنهجي��ة ُحم��ددة م�س��ب ًقا .وتعت��رب عملي��ة تقدي��ر املبيع��ات املحتمل��ة اأو الدخ��ل امل�س��تقبلي اأح��د الأمثل��ة ال�س��ائعة عل��ى التو ُّق��ع ،حي��ث يت��م ا�س��تخدام بيان��ات املبيع��ات اأو الدَ خ��ل ال�س��ابق كمرجع لتَو ُقع املبيعات امل�ستقبليةُ .وميكن تطبيق التو ُّقع يف الكثري من املجالت الأُخرى يف احلياة ،كتو ُّقع مقدار النمو ال�سكاين لالأعوام القادم��ة ،اأو تو ُّق��ع ع��دد ال�س��ياح الذي��ن �س��يزورون اململك��ة العربي��ة ال�س��عودية خالل فرتة حم��ددة ،وما اإىل ذلك. رغم وجود بع�ص اأوجه الت�سابه بني م�سطلحي التو ُّقع والتنبوؤ ،اإل اإنهما غري متطابقني. اإن التنب �وؤ ه��و عملي��ة اإن�س��اء من��وذج لتخم��ني اأو تقدي��ر نتيج��ة اأو ح��دث م��ا بن��ا ًء عل��ى ِقي��م ُمتغريات حالية ،بينما التو ُّقع هو عملية تقدير لقيمة متغري ما يف امل�س��تقبل بنا ًء على القيم ال�س��ابقة لنف���ص املتغ��ري يف اإط��ار زمن��ي ُحم��ددَ .يعن��ي ه��ذا اأن التو ُّق��ع ه��و ن��وع من اأن��واع التنبوؤ بعوامل يرتبط بالزمن .فالتو ُّقع ي�سري اإىل ال�سال�سل الزمنية وامل�ستقبلية ،بينما ُيعنى التنبوؤ ِ اأخ��رى غ��ري الزم��ن .ومبعن� ً�ى اآخ��ر ،فاإنك عندما تتنباأ بامل�س��تقبل فاأنت تتو ُّقع ،وميكنك القول ب�اأن جمي��ع التو ُّقع��ات ه��ي يف الواق��ع عب��ارة عن تنبوؤات ،بينم��ا ل ميكن و�سف جميع التنبوؤات باأنها تو ُّقعات ،كتلك احلالت التي يتم فيها ا�ستخدام النحدار ل�سرح العالقة بني متغريين على �س��بيل املثال.
الت� ُّقع (:)Forecasting ه��و و�س��ع تقدي��رات لأح��داث �ات اأو م�س��تقبلية بن��ا ًء عل��ى معلوم� ٍ بيان��ات �س��ابقة.
الطق���ص بالتنب�وؤ َ �درك خط�اأ ت�س��مية عملي��ة تو ُّق��ع َ وهك��ذا فق��د اأ�سبح��تَ ُت� ُ بالطق���ص ،فتو ُّق��ع الطق���ص يتنب�اأ بالطق���ص يف امل�س��تقبل با�س��تخدام معلوم��ات زمني��ة حم��ددة .عل��ى �س��بيل املث��ال ،اإذا كان��ت ال�س��ماء متط��ر الآن ،فم��ا ه��و احتمال ا�س��تمرار هط��ول الأمطار يف ُغ�س��ون الدقائق اخلم���ص القادم��ة؟ م��ن املمك��ن الق��ول بثق��ة اأن��ه و ِب َ�س��رف النظ��ر ع��ن جمي��ع العوامل الأخ��رى التي توؤثر على الطق���ص (مث��ل ال�سغط اجلوي ودرج��ة احل��رارة) ،ف�اإنَ احتمالي��ة ا�س��تمرار هط��ول الأمط��ار يف غ�س��ون خم���ص دقائ��ق �س��تكون ُمرتفع��ة ،لأنها متط��ر يف الوقت احلايل. تتيح تقنيات التو ُّقع لل�سركات واملوؤ�س�سات تعديل �سيا�ساتها واتخاذ القرارات ال�سليمة لتحقيق اأهدافها. يجب اتباع اخلط�ات التالية يف عملية الت� ُّقع: ُّ التوقع جدول :4.4خطوات و�سف اخلطوة
160
خطوة 1
حتديد البيانات املراد حتليلها وال�سعي للح�س�ل عليها.
خطوة 2
ا�ستخدام اأدوات برجمية الإعداد جمم�عة البيانات.
خطوة 3
َ�سبط ال�سل�سلة الزمنية املنا�سبة للت� ُّقع.
خطوة 4
اإن�ساء الت� ُّقعات.
خطوة 5
َمتثيل البيانات ر�س�م ًيا.
خطوة 6
َحتليل النتائج.
ُّ التوقع يف برنامج جداول البيانات اإك�سل
Forecasting in Excel
هن��اك العدي��د م��ن الأدوات الربجمي��ة الت��ي ُميك��ن ا�س��تخدامها لإن�س��اء من��وذج حتليل��ي للبيانات ال�س��ابقة للقي��ام بعملية التو ُّقع ،و ُيعترب مايكرو�س���فت اإك�س��ل ( )Microsoft Excelم��ن اأه��م ه��ذه الأدواتُ ،وميك��ن م��ن خالل��ه ا�س��تخدام البيان��ات ال�س��ابقة املُ�س��تندة اإىل الزم��ن م��ن اأج��ل اإن�س��اء تو ُّق��ع� .س��تتعلم يف ه��ذا الدر�ص خطوات تَو ُّقع اأعداد الرحالت ال�سياحية امل�ستقبلية اإىل اململكة العربية ال�سعودية وذلك ِبا�ستخدام برنامج اإك�سل ،حيث تقوم حتديدً ا باإجراء التو ُّقع يف هذا الربنامج للتنبوؤ باأعداد الرحالت ال�سياحية املتو ّقعة لكل �سهر من �سهور العام ،2023بنا ًء على املعطيات ال�سابقة للبيانات ال�سياحية للعام .2019
خطوة :1احل�سول على البيانات
Obtain the data
يتع��ني علي��ك يف البداي��ة احل�س��ول عل��ى البيان��ات املطلوب��ة لتحلي��ل التو ُّقع��ات؛ لأن اله��دف ه��و تو ُّق��ع الع��دد ال�س��هري للرح��الت �تجمع ه��ذه ال�س��ياحية للع��ام ،2023ولذل��ك اأن��ت بحاج��ة اإىل البيان��ات ال�س��ابقة لأع��داد تل��ك الرح��الت ،وله��ذا الغر���ص�َ ،س� َ البيان��ات م��ن �سفح��ة بيان��ات ال�س��ياحة التابع��ة ل��وزارة ال�س��ياحة ال�س��عودية م��ن خ��الل البواب��ة الوطني��ة للبيان��ات املفتوح��ة (ُ .)https://data.gov.saميكنك احل�سول على البيانات ال�سهرية ال�سياحية للعام 2019من خالل الرابط التايل: https://data.gov.sa/Data/ar/dataset/the-main-indicators-of-tourism-demand-statstics-2015-2020.
م��ن امله��م اأن تالح��ظ اأن��ه ل ميك��ن ا�س��تخدام بيان��ات العام��ني 2020و 2021ب�س��بب تاأث��ريات جائح��ة ك�رون��ا ( )COVID-19عل��ى ال�س��ياحة وال�س��فر، ولهذا ال�سبب �ستلجاأ لإجراء ح�سابات التو ُّقع با�ستخدام بيانات العام .2019 ام�سح َرمز اال�ستجابة
ال�سريعة ()QR code
لتحميل ملف البيانات.
هذه هي بيانات ال�سياحة للمملكة العربية ال�سع�دية لعام 2019
ال ُمقدمة من �سفحة بيانات ال�سياحة (وزارة ال�سياحة).
�سكل :4.8البوابة الوطنية للبيانات املفتوحة
161
لتحميل البيانات: ا�سغط على زر حتميل (1 .)Download يف نافذة التنزيالت ( ،)Downloadsا�سغط على فتح ملف (2 .)Open File يف ورق��ة العم��ل ،I1ح��دِّ د وان�س��خ حمتوي��ات اخلالي��ا 3 ،J59:J70واأل�سقه��ا يف اخلالي��ا A2: A13يف ملف اإك�سل جديد4 . اكتُب "ال�سهر" يف اخللية A1واأ�سف " "2019اإىل ا�سم كل �سهر يف اخللية5 . يف ورق��ة العم��ل I1م��ن مل��ف اإك�س��ل ال��ذي مت حتميل��ه ،ح��دد وان�س��خ حمتوي��ات اخلالي��ا 6 ،D59:D70واأل�سقه��ا يف اخلالي��ا B2: B13يف مل��ف الإك�س��ل7 . اكتُب "الرحالت ال�سياحية" يف اخللية 8 .B1
2
1
162
3 6
5 8
4
7
�سكل :4.9حتميل البيانات
163
خط�ة :2ا�ستخدم اأداة الت� ُّقع
Use a forecasting tool
بع��دَ ا ُ تعني علي��ك ت�سديرها حل�س��ول عل��ى بيان��ات اأع��داد الرح��الت ال�س��ياحية ال�س��هرية لع��ام َ ،2019ي َّ اإىل اأداة برجمي��ة للتو ُّق��ع� .ستَ�س��تخدم مايكرو�س��وفت اإك�س��ل له��ذا الغر���ص ،و�ستُن�س��ئ عمودي��ن يف ورق��ة جدي��دة ت�س��مى "� ."2019س��يحتوي العم��ود الأول عل��ى اأ�س��ماء اأ�س��هر ال�س��نة امليالدي��ة ،والعم��ود الث��اين على بيانات اأعداد الرحالت ال�س��ياحية لكل �س��هر من اأ�س��هر العام .2019
خط�ة � :3سبط ال�سال�سل الزمنية
Set the time series
تتطل� ُ�ب عملي��ة اإن�س��اء التو ُّق��ع يف مايكرو�س��وفت اإك�س��ل وج��ود عم��ود يحت��وي عل��ى �سل�س��لة زمني��ة ِب ِقي� ٍ�م رقمي��ة (اأرق��ام اأو تواري��خ) ،وله��ذا ال�س��بب ل ميكن��ك ا�س��تخدام العم��ود ال��ذي يحت��وي �ون البيان��ات في��ه ن�س َّي��ة .وللتغلُّ��ب عل��ى ه��ذه عل��ى اأ�س��ماء ال�س��هور كعم��ود �سل�س��لة زمني��ة وذل��ك ِل َك� ِ �كل مت�سل�س��ل امل�س��كلة� ،ستُن�س��ئ عم��ودًا ُ َميث��ل ال�س��هور ويحت��وي عل��ى الأرق��ام م��ن 1اإىل 12ب�س� ٍ كما هو مو�سح يف �سكل .4.10
ال�سال�سل الزمنية (:)Time series ه��ي جمموع��ة م��ن البيان��ات الكمي��ة، ومتث��ل و�س ًف��ا لواح��دة اأو اأك��رث م��ن ال�سف��ات اأو اخل�سائ���ص املتعلق��ة ب�س��خ�ص اأو ظاه��رة اأو ح��دث مع��ني، والت��ي يت��م جمعها خالل فرتات زمنية متتابع��ة.
اأرقام ت�سل�سلية. عدد الرحالت ال�سياحية ال�افدة للمملكة العربية ال�سع�دية (مقد ًرا باالآالف).
ت َتطل��ب ال�سل�س��لة الزمني��ة ف��رتات زمنية ُمت�س��قة ب��ني نق��اط البيان��ات� ،س��واء كان��ت تل��ك البيان��ات ف��رتات زمني��ة اأو تواري��خ ُمثّلة على �س��كل رقمي. �س َت�س��تخدم االأرقام الت�سل�س��لية املمثلة لل�س��هور يف العم��ود ( )Aلل�سل�س��لة الزمني��ة ولي���س العمود ()B الذي يحتوي على القيم الن�سية الأ�سماء ال�سهور.
يحت�ي العم�د Bعلى اأ�سماء ال�سه�ر في العام .2019 �سكل :4.10البيانات يف ورقة عمل اإك�سل
164
خط�ة :4اإن�ساء الت� ُّقع
Create the forecast
ا�س��تنادًا اإىل بيان��ات اأع��داد الرح��الت ال�س��ياحية ال�س��هرية لع��ام � ،2019ستَ�س��تخدم خي��ار ورق��ة التنب ��ؤ ( )Forecast sheetم��ن عالم��ة تبوي��ب بيان��ات ( )Dataيف مايكرو�س��وفت اإك�س��ل م��ن اأج��ل اإن�س��اء التو ُّق��ع. ُّ التوقع: الإن�ساء ا�سغط على اخللية 1 .A1 ا�سغ��ط عل��ى عالم��ة تبوي��ب بيان��ات ( 2 ،)Dataوم��ن جمموع��ة تنب��ؤ ( ،)forecastا�سغ��ط عل��ى ورق��ة التنب��ؤ (3 .)Forecast sheet �ستظهر نافذة اإن�ساء ورقة عمل التنب�ؤ (4 .)Create Forecast Worksheet ي�س��تخدم مايكرو�س��وفت اخرت املخطط اخلطي (5 .)Line chart اإك�س��ل م�سطل��ح خمتل��ف ُّ التوقع ()Forecast مل�سطلح ا�سبط قيمة نهاية التنب�ؤ ( )Forecast endعلى 6 .24 وه��و التنب��وؤ. ا�سغط على خيارات ( 7 ،)Optionsلعمل التغيريات يف اإعدادات التو ُّقع الإ�سافية. ا�سغط على اإن�ساء (8 .)Create �ستجد ورقة العمل اجلديدة التي حتتوي على ِق ِيم التو ُّقع اإىل ميني الورقة حيث اأدخلت �سل�سلة البيانات. 2
3
1 4 5
7
6
تم تحديد الرقم 24كنهاية للتنب�ؤ َك ْ�ن البيانات المت�فرة هي لمدة � 12سه ًرا ،وتريد ت� ُّق ًعا لالأ�سهر 12القادمة ،وبالتالي نتجت القيمة من.24 = 12 + 12 :
8
يمكن عر�س الت� ُّقع با�ستخدام مخطط خطي اأو مخطط عم�دي. 165
يعر�س العم�دان Dو Eحالة عدم اليقين الم�ج�دة في الت� ُّقع.
يحت�ي العم�د Cعلى القيم التي تم ت�قعها. 9
عندم��ا تُن�س��ئ تو ُّق ًع��اُ ،ين�س��ئ اإك�س��ل ورق��ة عم��ل جدي��دة حتت��وي عل��ى ج��دول قي��م البيان��ات ال�س��ابقة وقي��م البيان��ات (امل�س��تقبلية) الت��ي مت توقعه��ا، وكذل��ك يت��م عر���ص مق��دار ع��دم اليق��ن ( )Uncertainityا ً أي�س��ا م��ع احل��د االأعل��ى للثق��ة ( )Upper Confidence Boundواحل��د االأدن��ى للثق��ة ( ،)lower Confidence Boundويق��وم اإك�س��ل باإن�س��اء املخط��ط املح��دد لتمثي��ل ه��ذه البيان��ات.
التمثيل الر�س�مي للت� ُّقع.
�سكل :4.11اإن�ساء التو ُّقع
166
ُّ التوقع االإ�سافية اإعدادات
Additional forecast settings
َي�س��تخدم النم��وذج برنام��ج اإك�س��ل لتو ُّق��ع القي��م امل�س��تقبلية للبيان��ات بن��ا ًء عل��ى القي��م املوج��ودة (البيان��ات ال�س��ابقة) با�س��تخدام االنح��دار اخلط��ي ( )Linear Regressionوه��و من��وذج اإح�سائ��ي لك�س��ف العالق��ة ب��ني متغريي��ن م�س��تمرين ،حي��ث يت��م التنبوؤ من خالل��ه ِبقيم ُمتغري تاب��ع بن��ا ًء عل��ى قي��م ُمتغ��ري م�س��تقل (يف املث��ال ال�س��ابق املتعل��ق بال�س��ياحة ميث��ل ع��دد الرحالت ال�س��ياحية املتغ��ري التابع ،بينم��ا يكون املتغري امل�ستقل هو الوقت ً نوعا اأ�سا�س ًيا و�سائع ال�ستخدام يف التحليل التنبوؤي والذي يتيح فهم ودرا�سة ممثال بال�سهور) .و ُيع ُّد النحدار اخلطي ً العالقة الكمية بني متغريين م�س��تمرين.
مخطط خطي (.)Line chart اإذا قمت بال�سغط على خيارات ( ،)Optionsف�ستظهر قائمة من�سدلة ُتم ِّكنك من تغيير االإعدادات المتقدمة الخا�سة بالتنب�ؤ.
�سكل :4.12اإعدادات التو ُّقع الإ�سافية
من خالل اختيار الك�سف تلقائ ًيا ( ،)Detect Automaticallyيُمكن لبرنامج اإك�سل تعيين قيمة الم��سمية ( )Seasonalityتلقائ ًيا اإلى .12
يحدد فا�سل الثقة ()Confidence interval
�سيوعا وموثوقية للتنبوؤ يف النموذج ،اإل اأنه َيفتقر اإىل على الرغم من اأن النحدار اخلطي هو الأكرث ً اإمكانية التعامل مع البيانات النوعية .فعلى �سبيل املثال ،قد تَتمثل بع�ص البيانات النوعية يف املثال املتعلق بال�سياحة يف تف�سيالت ال�سائحني بخ�سو�ص توقيت ح�سولهم على العطلة اأو الإجازة ،و ُت َع ُّد هذه البيانات ذات تاأثري يف م�ساألة اختيار زمان ومكان ق�ساء العطلة .قد تعمل دالة التو ُّقع القائمة عل��ى النح��دار اخلط��ي يف بع���ص الأحي��ان ،ولك��ن عدم تعامل النح��دار اخلطي مع البيانات النوعية يجعل الكثري من التو ُّقعات بعيدة عن الواقع ب�سكل كبري ،مما يوؤثر �سل ًبا على التنبوؤات ب�سكل عام.
دقة التنب�ؤ.
ي�س��تخدم مايكرو�س��وفت اإك�س��ل م�سطل��ح خمتل��ف مل�سطل��ح نط��اق الثق��ة ()Confidence interval وه��و فا�س��ل الثق��ة.
167
نطاق الثقة
Confidence Interval
�ني م��ن ال�س��ك وع��دم التيق��ن بحدوث��ه ،فالتو ُّق��ع كما َينط��وي اأي تو ُّق��ع با�س��تخدام النمذج��ة عل��ى َق� ْ�د ٍر ُمع� َّ ٍ تعلمت ل يت�سمن قي ًما حقيقية مت جمعها اأو قيا�س��ها من خالل البحث مث ًال ،بل هي قيم تقديرية غري موج��ودة بالفعل بعد. حتتم��ل القي��م الت��ي يت��م تخمينه��ا ال�س��واب اأو اخلط�اأ يف امل�س��تقبل ِبغ��ِّ�ص النظ��ر ع��ن الطريق��ة الت��ي مت تخمينه��ا به��ا ،ويعط��ي نط��اق الثق��ة جمموع��ة من القيم املتو ّقعة ولي���ص فقط قيم��ة متو ُّقعة واحدة ،و يتم حتدي��د ه��ذه الف��رتة م��ن خ��الل احل��د الأدن��ى واحل��د الأعل��ى للثق��ة ،وهكذا ف�اإن القيمة الفعلي��ة يجب األ تق��ل ع��ن قيم��ة احل��د الأدن��ى للثق��ة واأل تزيد عن احل��د الأعلى للثقة. ُتع� َرف ه��ذه القي��م اإح�سائ ًي��ا با�س��م نط��اق الثق��ة ومت ِّث��ل ِنطا ًق��ا م��ن القي��م املُق� َّدرة ملتغ��ري م��ا ،وميك��ن النظ��ر اإليه��ا عل��ى اأنه��ا متو�س��ط القيم��ة التي يتم تخمينها للمتغ��ري ±نطاق الختالف يف هذا التخمني. يت��م ح�س��اب نط��اق الثق��ة ِوف��ق م�س��توىً حم��دد ،وعادة ما ي�س��اوي ،95%ويعني ه��ذا اأن القيمة احلقيقية لديها فر�سة بن�سبة 95%لتقع بني نطاق القيم املتو ّقعة بني احلد الأدنى للثقة واحلد الأعلى للثقة. ي�سري التنبوؤ الذي ُقمت به يف اإك�سل بخ�سو�ص اأعداد الرحالت ال�سياحية اإىل اأن��ه م��ن املتو ّق��ع و�س��ول 1,305,000رحل��ة �س��ياحية يف �س��هر يناي��ر ،2023م��ع ح��د اأدن��ى للثق��ة مق��داره ،232,000وح��د اأعل��ى للثق��ة مق��داره .2,378,000وهك��ذا ف�اإن نط��اق الثق��ة ينح�س��ر يف القي��م الواقع��ة م��ا ب��ني 232,000و .2,378,000و ُيح َّد ُد م�ستوى الثقة يف اإجراء التو ُّقع يف اإك�سل بن�سبة ،95%وبناء على ذلك فاإن عدد الرحالت ال�سياحية املتو ّقعة ل�سهر يناي��ر 2023حتظ��ى بفر�س��ة بن�س��بة 95%لأن تك��ون ب��ني 232،000و .2,378,000 اإذا كان ع��دد الرح��الت ال�س��ياحية يف �س��هر يناي��ر 2023ي�س��اوي متام��ا .ورغ��م اأن القيم��ة ،1000,000فه��ذا يعن��ي اأن التنب�وؤ كان �سحيح��ا ً ً 1000،000ل ت�ساوي القيمة 1,305,000التي ح�سلنا عليها من التو ُّقع، اإل اأن تل��ك القيم��ة تق��ع يف نط��اق القيمت��ني 232,000و ،2,378,000اأي �سم��ن نط��اق الثق��ة.
�سكل :4.13نطاق الثقة
168
نطاق الثقة (:)Confidence Interval لنط��اق الثق��ة احتم��ا ٌل مع��روف وحمك��وم عموم��ا بن�س��بة ت��رتاوح ب��ني 95%و 99% ً م��ن القيم��ة احلقيقي��ة.
خط�ة :5متثيل البيانات ر�س�م ًيا
Graph the data
كما تعلمت �ساب ًقاُ ،ميكن متثيل التو ُّقعات با�ستخدام خمطط خطي ( )Line Chartاأو خمطط عم�دي (:)Column Chart
املخطط اخلطي
Line Chart
قيم ُم َعينة مبرور الوقت ،وذلك على �سورة ِ�سل�س��لة من تُ�س��تخدم املخططات اخلطية على نطاقٍ وا�س� ٍ�ع لتمثيل ُّ التغريات التي حدثت على ٍ �اعد يف حتديد العالقة بني جمموعتني من القيم ،كمجموعة �س��هور العام التي متثل نقاط البيانات املت�سلة م ًعا بخطوط م�س��تقيمة ،وتُ�س� ِ قي��م الوق��ت ،وجمموع��ة ع��دد الرح��الت ال�س��ياحية ،وبالطب��ع ل ب��د م��ن اأن تك��ون جمموع��ة بيان��ات تعتم��د دائ ًما على املجموع��ة الأخرى (يف املثال ال�س��ابق يعتمد عدد الرحالت ال�س��ياحية على الوقت). فوائد املخططات اخلطية: ت�سمح بالتحليل ال�سريع للبيانات. ت�سمح مبراقبة التغيريات ب�سه�لة خالل فرتة زمنية معينة. ميكن االعتماد عليها لتمثيل جمم�عات البيانات التي حتت�ي على 50قيمة كحد اأعلى. ُت�ساعد يف ا�ستنباط تنب�ؤات ح�ل نتائج بيانات مل يتم ت�سجيلها بعد.
املخطط العمودي
Column Chart
تُ�س��تخدم املخطط��ات العمودي��ة لعر���ص البيان��ات الت��ي مت جمعه��ا م��ن خ��الل ال�س��تبانات واملقاب��الت مث��ل بيان��ات الفئ��ات العمري��ة واأع��داد املنتج��ات املف�سل��ة للزبائ��ن وغريه��اُ ،وميك��ن ا�س��تخدامها ا ً أي�س��ا م��ع البيان��ات مث��ل جمموع��ات البيان��ات الأخ��رى كالبيان��ات ال�س��هرية لعدد الرح��الت ال�س��ياحية�َ ،س� َ عدد كب� ٍري من القيم. �رط األ حتت��وي ه��ذه املجموع��ات عل��ى ٍ فوائد املخططات العمودية: تتيح املقارنة بن جمم�عات البيانات ب�سه�لة. ُميكن من خاللها تلخي�س كمية كبرية من البيانات ب�س�رة مرئية ي�سهل تف�سريها. ُت�سهِّل من مالحظة الت�جهات. ُت�ساعد على درا�سة االأمناط يف البيانات على امتداد فرتة ط�يلة من الزمن.
169
متنح��ك ورق��ة عم��ل التنب�وؤ يف اإك�س��ل االختي��ار ب��ني املخط��ط اخلط��ي واملخط��ط العم��ودي لتمثي��ل البيان��ات ،ولق��د مت ا�س��تخدام املخط��ط اخلط��ي يف املث��ال املتعل��ق بال�س��ياحة ،وذلك لكون��ه اأك��ر مالءم��ة للتمثيل املرئ��ي للبيانات.
ُت�سير الح�اف العل�ية لجميع الخط�ط الرمادية اإلى قيم الحد االأعلى للثقة.
ُت�سير الح�اف ال�سفلية لجميع الخط�ط الرمادية اإلى قيم الحد االأدنى للثقة.
170
�سكل :4.14املخطط العمودي
تخ�سي�س الر�سومات
Customize the Graphics
منوذج ثاب��ت ،ولكن ُميكنك حترير يق��وم برنام��ج اإك�س��ل باإن�س��اء ورق��ة العم��ل اجلدي��دة بقي��م التو ُّق��ع واأعم��دة للح��د الأعلى للثقة و احلد الأدنى للثقة ح�س��ب ٍ اأ�سماء الأعمدة وتعديلها. لتغيري اأ�سماء االأعمدة: يف ورقة عمل التنب�ؤ ،ا�سغط على اخللية 1 .D1 ح��دِّ د الكلم��ات املوج��ودة يف اخللي��ة ،واكت��ب "احل��د الأدن��ى للثقة" وا�سغط على 2 . Enter ا�سغ��ط عل��ى اخللي��ة ،E1واكت��ب "احل��د الأعل��ى للثق��ة" وا�سغ��ط عل��ى 3 . Enter �س��يتم تطبي��ق التغي��ريات يف ورق��ة عم��ل التنب��ؤ 4 ،وعل��ى أي�سا5 . املخطط اخلطي ا ً
2 1 3
4
5 �سكل :4.15تغيري اأ�سماء الأعمدة
171
كما تُالحظ يف املخطط اخلطي الذي مت اإن�ساوؤه �ساب ًقا ،فاإن ت�سمية املحور الأفقي لي�ست منا�سبة ،حيث تظهر �سل�سلة من الأرقام كعنوان للمحور الأفقي ً بدل من اأ�سماء ال�سهور. ولت�سحيح ذلك ،يجب تعديل املُخطط عن طريق تغيري �سل�سلة البيانات. لتعديل �سل�سلة البيانات: يف ورقة عمل " ،"2019ويف نهاية العمود ،Bاأ�سف اأ�سماء الأ�سهر للعام 1 .2023 يف ورقة العمل التي حتتوي على قيم التو ُّقع املُن�ساأة واملُخطط ،ا�سغط داخل املُخطط، 2ثم ا�سغط على اأيقونة ع�امل ت�سفية املخطط (3 .)Chart Filters ا�سغط على حتديد البيانات (4 .)Select data �س��تظهر ناف��ذة حتدي��د م�س��در البيان��ات ( ،)Select data sourceوم��ن ت�س��ميات املح���ر (الفئ��ة) االأفق��ي ( ،)Horizontal )Category( Axis Labelsا�سغ��ط عل��ى حتري��ر (5 .)Edit من ورقة عمل " ،"2019ح َّدد اأ�سماء ال�سهور6 . من نافذة ت�سميات املحاور ( ،)Axis Labelsا�سغط على م�افق (7 .)OK ث��م م��ن ناف��ذة حتدي��د م�س��در البيان��ات ( ،)Select Data Sourceا�سغ��ط عل��ى م�اف��ق (8 .)OK �ستظهر اأ�سماء ال�سهور كت�سميات على املحور الأفقي9 .
1
2
3
4
172
5
7 6
8
9
�سكل :4.16تعديل �سل�سلة البيانات
173
وللمزيد من التخ�سي�ص للمخطط اخلطي ،ميكنك اإ�سافة عناوين للمحورين xو.y لتغيري عناوين الت�سمية: حدِّ د املخطط اخلطي 1 ،ثم ا�سغط على اأيقونة 2 .+ حدِّ د خيار عناوين املحاور (3 .)Axis Titles يف مربع��ات الت�س��مية الت��ي تظه��ر ،ا�سغ��ط عل��ى كل منه��ا واكت��ب العن��وان ال�سحي��ح للمح��ور4 . �ستظهر الت�سميات ال�سحيحة يف املخطط اخلطي5 .
2
1
3
4
5
�سكل :4.17تغيري عناوين الت�سمية
174
خط�ة :6حتليل البيانات
Analyze the data
ق��د حتت��اج يف بع���ص الأحي��ان اإىل ِّ الط��الع عل��ى م��دى الخت��الف ب��ني القي��م املُتو ُّقع��ة وال ِقيم الأولي��ة ،وذلك من اأجل فه� ٍ�م اأف�سل للظاهرة قيد الدرا�س��ة وللتو�سل اإىل ال�س��تنتاجات ال�سحيحة .بالعودة اإىل املثال ال�س��ابق املتعلق بال�س��ياحة ،قد تَو ُّد معرفة اأي ال�س��هور يف العام ْ ِّ ُ ارتفاع��ا يف ع��دد الرح��الت ال�س��ياحية الواف��دة ،واأيه��ا اأق��ل .متك��ن ه��ذه املعلومات �س َّناع القرار من و�سع الإ�س��رتاتيجبات � 2023سي�س��هد ً الت�س��ويقية وتنظي��م احلم��الت الرتويجي��ة املنا�س��بة جل��ذب املزي��د م��ن الرحالت ال�س��ياحية .للح�سول على هذه املعلومات� ،س��تطرح قيمة العدد املتو ّقع للرحالت ال�سياحية من قيمة العدد ال�سابق للرحالت ال�سياحية ،وبالتايل �ستح�سل على قيمة التباين يف البيانات املتو ّقعة. الإعداد ورقة عمل جديدة: يف ورقة )Sheet2( 2اجلديدة ،اأن�سئ عمودًا با�سم ال�سهر1 . م��ن ورق��ة عم��ل " ،"2019ان�س��خ القي��م اخلا�س��ة بالرح��الت ال�س��ياحية وعدده��ا 2 ،12 واأل�سقه��ا يف ورق��ة ،)Sheet2( 2يف عم��ود الرح��الت ال�س��ياحية 3 . 2019 ِم��ن ورق��ة ،)Sheet 1( 1ح��دِّ د القي��م املتو ّقع��ة للرح��الت ال�س��ياحية وعدده��ا 4 ،12 واأل�سقه��ا كقي��م يف ورق��ة ،)Sheet 2( 2يف عم��ود الرح��الت ال�س��ياحية 5 .2023
حتليل البيانات
(:)Data Analysis ه��و الفح���ص املنهج��ي للبيان��ات ع��ن طري��ق العين��ات والقيا���ص والت�سو ي��ر.
1
175
2
3
4
�سكل :4.18اإعداد ورقة عمل جديدة
176
5
ُّ التوقعات: حل�ساب فرق يف ورقة ،)Sheet 2( 2اأن�سئ عمودًا جديدً ا با�سم فرق الت�قعات . يف اخللية ،D2اكتب ال�سيغة " 2 ."=C2-B2 ان�سخ ال�سيغة من اخللية D2اإىل اخللية D13حل�ساب باقي القيم.
1
3
1
2
3
�سكل :4.19ح�ساب فرق التو ُّقعات
177
اإن�ساء خمطط عمودي متفاوت امل�سافات
Creating Clustered Column Chart
بالإ�سافة اإىل خمطط التو ُّقع الذي قمت باإن�سائه �سابق ًا� ،ستقوم باإن�ساء خمططني اآخرين ت�ستخدمهما يف التحليل. ب�سكل اأكرث حتديدً ا� ،ستُن�سئ التايل: خمطط بياين لتمثيل املقارنة بني بيانات الرحالت ال�سياحية ال�سابقة وبيانات الرحالت ال�سياحية املتو ّقعة. خمطط بياين يو�سح الفرق املتو َّقع بني بيانات الرحالت ال�سياحية ال�سابقة وبيانات الرحالت ال�سياحية املتو ّقعة. الإن�ساء خمطط عمودي متفاوت امل�سافات: حدد الأعمدة Aو Bو 1 .C م��ن عالم��ة تبوي��ب اإدراج ( ،)Insertا�سغ��ط عل��ى املخطط��ات امل��س��ى به��ا (2 .)Recommended Charts اخرت خمطط عم�دي متفاوت امل�سافات (3 .)Clustered Column chart ا�سغط على م�افق (4 .)OK 2
3
1 �سكل :4.20اإن�ساء خمطط عمودي متفاوت امل�سافات
3
4 178
مي ِّثل هذا املخطط البياين املقارنة بني بيانات الرحالت ال�سياحية ال�سابقة ،وبيانات الرحالت ال�سياحية املتو ّقعة .وميكنك تغيري حدود متثيل اأو�سح للبيانات. اأو وحدات املحور العمودي لعر�ص ٍ
عند المقارنة مع المخطط البياني ا الأول ،يحت�ي هذا المخطط على َتد ُّر ج اأ�سغر لل�حدات بقيمة ً 250 (بدال من 500كما في المخطط البياني االأولي).
�سكل :4.21خمطط عمودي متفاوت امل�سافات
عندم��ا يتعل��ق الأم��ر بتمثي��ل املعلوم��ات يف اإك�س��ل ،فم��ن امله��م ج��دً ا اختيار النوع املنا�سب وال�سحيح للمخططات ،وذلك ليتمكن اجلمهور من قراءتها وفهمها ب�سهولة. وله��ذا الغر���ص ،علي��ك اختي��ار املخطط��ات التي ُيو�سي بها اإك�س��ل، حيث تكون يف اأغلب احلالت منا�سب ٍة لنوع البيانات املتوفر ،فاختيارك ً خمططا غري منا�س��ب لتمثيل البيانات �س��يوؤدي اإىل احل�سول على متثيل مرئي ل ميكن فهمه اأو تف�س��ري حمتواهُ .يظهر ال�س��كل 4.22 ٍ ً مثال على نتيجة الختيار اخلاطئ لنوع املخطط البياين. �سكل :4.22خمطط خطي غري مفهوم
179
املخطط العمودي املكد�س
Stacked Column Chart
2
الإن�ساء خمطط عمودي مكد�س: حدِّ د الأعمدة Aو Bو1 .D َ م��ن عالم��ة تبوي��ب اإدراج ( ،)Insertا�سغ��ط عل��ى املخطط��ات امل��س��ى به��ا (2 .)Recommended Charts اخ��رت خمط��ط عم���دي مكد���س بن�س��بة % 100 (3 .)Stacked Column ا�سغط على م�افق (4 .)OK
1
ُي�س��تخدم املخط��ط العم��ودي املكد���س ملقارن��ة قيم��ة معين��ة م��ع جمم��وع قي��م تت�سم��ن تل��ك القيم��ة ،وميكن��ك ا�س��تخدامه الإظه��ار كيفي��ة م�س��اهمة قيم��ة معينة يف التغيريات عرب الوقت.
3
4 �سكل :4.23اإن�ساء خمطط عمودي مكد�ص
180
ُميثل املخطط البياين يف ال�س��كل 4.24الفرق املتو ّقع بني عدد الرحالت ال�س��ياحية ال�س��ابقة وعدد الرحالت ال�س��ياحية املتو ّقعة ،وميكنك و�سوحا. تغيري حدود اأو وحدات املحور الراأ�سي لتمثيل املعلومات ب�سكل اأكرث ً
�سكل :4.24خمطط عمودي مكدّ�ص
�الت معين��ة .فعل��ى �س��بيل املث��الُ ،يو�س��ي اإك�س��ل يف املثال ال�س��ابق با�س��تخدام ق��د ل تك��ون املخطط��ات املُو�س��ى به��ا يف اإك�س��ل منا�س��ب ًة لتمثي��ل املعلوم��ات يف ح� ٍ خمط��ط ُقمع��ي ( )Funnel Chartكم��ا يف ال�س��كل ،4.25اأو خمط��ط مبع��ر ( )Scatter Chartكم��ا يف ال�س��كل ،4.26واإذا قم��ت با ِّتب��اع التو�سي��ة وا�س��تخدام تل��ك املخطط��ات ،ف�س��تح�سل عل��ى خمطط��ات غ��ري منا�س��بة ،وي�سعب قراءتها اأو فه��م معانيها.
�سكل :4.25خمطط ُقمعي
�سكل :4.26خمطط مبعرث
يج��ب الأخ��ذ بالعتب��ار اأن بع���ص اأن��واع املخطط��ات ق��د ل تتنا�س��ب م��ع حاج��ات اأو ق��درات اجلمه��ور ،فبع�ص تلك الأنواع -وكما ه��و احلال يف بع�ص الربامج والأدوات – هو منا�س� ٌ�ب للعلماء والباحثني وخرباء الت�س��ويق .ومن ال�س��ائع ا ً أي�سا اأن امل�س�وؤولني التنفيذيني ومدراء ال�س��ركات يحتاجون اأنواع ًا حمددة من املخططات. 181
مترينات 1
حدد اجلملة ال�سحيحة واجلملة اخلاطئة فيما يلي: ُ .1ي َع ُّد التو ُّقع الطريقة الوحيدة للتنبوؤ بالبيانات امل�ستقبلية بنا ًء على البيانات ال�سابقة. .2اإن حتديد اخلطوات بو�سوح قبل تنفيذ اإجراء التو ُّقع هو اأهم متطلبات التو ُّقع اجليد. ال�ست للتو ُّقع بالرتتيب. .3لي�ص من ال�سروري اتباع اخلطوات ْ .4مينحك نطاق الثقة معلومات حول ن�سبة ال�سك وعدم التيقن بحدوث التنبوؤ. .5التنبوؤ بنطاق ثقة ي�ساوي 95%هو اأكرث دقة من تنبوؤ بنطاق ثقة ي�ساوي .75%
.6ي�سري التنبوؤ والتو ُّقع اإىل نف�ص الإجراء. ُ .7ي َف َّ�سل ا�ستخدام املخطط البياين اخلطي على املخطط العمودي يف متثيل التو ُّقع. ُ .8ي َف َّ�سل اختيار املخططات التي يو�سي بها اإك�سل ملنا�سبتها لنوع البيانات امل�ستخدم. .9يعتمد اختيار املخطط ال�سحيح لتمثيل البيانات على املعلومات التي �سيتم متثيلها باملخطط. .10حتدد حدود الثقة الدنيا والعليا النطاق املقبول لقيم البيانات.
182
�سحيحة
خاطئة
2ق��ارن ب��ن ن�ع��ي املخطط��ن اللذي��ن يقدمهم��ا اإج��راء الت� ُّق��ع يف اإك�س��ل ،ومل��اذا ُيع��دُّ املخط��ط اخلط��ي ه��� االأن�س��ب ح�سب راأيك؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
3ق��م بزي��ارة �سفح��ة بيان��ات ال�س��ياحة التابع��ة ل���زارة ال�س��ياحة ال�س��ع�دية يف الب�اب��ة ال�طني��ة للبيان��ات املفت�ح��ة ( )https://data.gov.saث��م ق��م بتحمي��ل بيان��ات الرح��الت ال�س��ياحية للعام��ن 2017و .2018ث��م ط ِّب��ق اإج��راء الت� ُّق��ع للع��ام ِّ 2023 وو�س��ح النتائ��ج .اذك��ر املخطط��ات البياني��ة الت��ي �س��تختارها لعر���س النتائ��ج؟ ومل��اذا؟ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
183
4ح ِّلل نتائج الت� ُّقع لبيانات الرحالت ال�س��ياحية التي ح�سلت عليها من التمرين الثالث للعامن 2017و،2018 ثم قم باإن�ساء اأوراق العمل املطل�بة يف اإك�سل وقارن بن النتائج .ما ه� اجلزء املهم يف هذه املخططات الت��سيحية عند اإجراء املقارنة بينها؟ ِّ و�سح اإجابتك. ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________ ___________________________________________________________________________________________
5م�س��تعي ًنا ب �اأوراق عم��ل اإك�س��ل الت��ي اأن�س �اأتها يف التمري��ن الراب��ع ،ق��م بتمثي��ل البيان��ات با�س��تخدام االأن���اع املختلف��ة للمخطط��ات يف اإك�س��ل .م��ا ه��ي اأن�س��ب اأن���اع املخطط��ات لتمثي��ل ه��ذه املعل�م��ات؟ ِّ و�س��ح اإجابت��ك. _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________ _________________________________________________________________________________________
184
الدر�س الثالث
التح�سني
()Optimization
التعامل مع م�ساكل التح�سني
Dealing with Optimization Problems
يواجه الإن�سان امل�ساكل املتعلقة بالتح�سني يف الكثري من جوانب احلياة وجمالتها كالأعمال التجارية، والقت�ساد ،والريا�سيات ،والهند�سة ،والعلوم .تَك ُمن امل�سكلة الأ�سا�سية يف حماولة اإيجاد الطريقة املُثلى اأو الأكرث فاعلية ل�ستخدام املوارد املحدودة لتحقيق هدف معني والذي قد يكون زيادة الربح ،اأو تقليل لل�سفر اإىل وجهة معينة. التكلفة ،اأو تقليل الوقت الالزم لتنفيذ م�سروع ما ،اأو اخت�سار الوقت اأو امل�سافة ِ ُيع ُّد ا�ستقطاب املزيد من الرحالت ال�سياحية اإىل بلدٍ ما اأحد اأهداف التح�سني ،كما ميكن النظر اإىل بع�ص الأمثلة الأُخرى حول التح�سني ،كتحديد امليزانية املنا�سبة حلملة ت�سويقية ،اأو ت�سميم اجلدول املثايل لعمل املوظفني ،اأو خف�ص تكلفة التو�سيل.
ما هي اأداة اإك�سل �سولفر؟
التح�سن (:)Optimization ه��و عملي��ة اختي��ار العن�س��ر الأف�س��ل م��ن جمموع��ة م��ن البدائ��ل وذل��ك حت��ت قي��ود معين��ة.
?What is Excel Solver
تُعت��رب اأداة اإك�س��ل �س���لفر ( )Excel Solverاأداة برجمي��ة تُ�س��تخدم ملح��اكاة وحت�س��ني من��اذج الهند�س��ة والأعم��ال املختلف��ة .تنتم��ي ه��ذه الأداة اإىل جمموع� ٍة خا�س��ة من اأدوات اإك�س��ل ُي�س��ار اإليها با�س��م اأدوات �وذج يحت��وي حتلي��ل م��اذا-اإذا ( )What-Ιf Analysis toolsوت�س��تخدم للو�س��ول اإىل اأف�س��ل احلل��ول لنم� ٍ على ُمدخالت متعددة. ُتع� ُّد احلاج��ة اإىل حتدي��د قيم��ة خللي��ة واح��دة (تُ�س��مى اخللي��ة اله��دف) ع��ن طري��ق تغي��ري قي��م خالي��ا اأخ��رى معين��ة (ت�س��مى خالي��ا املُتغ��ري) وذل��ك با�س��تخدام القي��ود اأو بدونه��ا ،م��ن اأك��رث ال�س��تخدامات �يوعا لأداة اإك�س��ل �س��ولفر ،حي��ث تعت��رب ه��ذه الأداة مثالي��ة حل��ل م�س��اكل الربجمة اخلطي��ة (املعروفة �س� ً ا ً أي�سا با�س��م م�س��اكل التح�س��ني اخلطي) ،ولذلك ُيطلق عليها اأحيا ًنا ا�س��م الرجمة اخلطية ل�س���لفر (.)Linear Programming Solver ُتع��د اأداة اإك�س��ل �س��ولفر مثالي��ة للتعام��ل م��ع م�س��اكل التح�س��ني ،حي��ث ُمت ِّكن��ك م��ن ا�س��تخدام ج��داول البيان��ات لإدراج متغ��ريات الق��رار وقي��ود النم��وذج ،ث��م تنفي��ذ دال��ة اله��دف التي ت�سفه��ا .ويف حني ُيع ُّد ا�س��تخدام النماذج ال�س��بكية ( )Graphical Modelsمثالي ًا حلل النموذج الذي يحتوي على متغريين للق��رار ،تت�سم��ن الكث��ري م��ن امل�س��اكل يف احلي��اة الواقعي��ة متغ��ريات عدي��دة ،ولذل��ك هن��اك حاج��ة اإىل ا�س��تخدام تقني��ات وح�س��ابات ُمعق��دة للو�س��ول اإىل احل��ل الأمثل ملثل تلك امل�س��اكل. تُ�ساهم جداول البيانات واأداة �سولفر يف حل م�ساكل التح�سني بطريقة ُمب�سطة ومالئمة للم�ستخدمني ِب�سرف النظر عن قدراتهم احل�سابية.
م��ن ال�س��روري فه��م اإمكاني��ة اإج��راء تغي��ريات عل��ى ُمعامِ��الت اأداة �س��ولفر اأو عل��ى االإج��راء ال��ذي يت��م تنفي��ذه يف اأي بن��اء عل��ى النتائ��ج الت��ي وق��ت ،وبذل��ك ً تقدمه��ا االأداة ،ميك��ن اإع��ادة تقيي��م امل�سكلة وحتديد ما اإذا كانت هناك حاجة اإىل تنفي��ذ عملي��ة ه��ذه االأداة مع تطبيق قي��ود معين��ة .ال ُتع��دُّ النتائ��ج يف �س��ولفر جم��رد اأرق��ام فقط ،بل هي قيم ذات معنى حمدد تخ�س املوقف قيد الدرا�سة ،ولذلك عال البيانات اأو حملل االأعمال يجب على ِ اإج��راء تقييم نقدي لهذه النتائج واتخاذ اإج��راءات اإ�سافي��ة اإذا كان��ت النتائ��ج غري مر�سي��ة.
185
�سياغة امل�سكلة
Formulating the Problem
قبل ت�سغيل اأداة اإك�سل �سولفر ،يجب �سياغة امل�سكلة (النموذج) يف ورقة عمل ،حيث يع ّرف هذا النموذج امل�سكلة التي تريد اإيجاد حل لها. لقد جمعت يف الدر���ص ال�س��ابق بيانات الرحالت ال�س��ياحية ال�س��هرية للعام 2019من �سفحة بيانات ال�س��ياحة التابعة لوزارة ال�س��ياحة ال�س��عودية يف البواب��ة الوطني��ة للبيان��ات املفتوح��ة ( ،)https://data.gov.saويف ه��ذا الدر���ص �ست�س��تخدم نف���ص البيان��ات م��ن اأجل الو�س��ول اإىل نتائج حمددة ت�س��اعد يف تنظيم حمالت للرتويج لل�س��ياحة يف اململكة العربية ال�س��عودية للعام ،2023وذلك با�س��تخدام اأداة اإك�س��ل �س��ولفر .لتحقيق ذلك ،يتعني عليك ا ًأول �سياغة امل�سكلة ثم حتديد نوع املعلومات التي تريد احل�سول عليها من اأداة اإك�سل �سولفر.
ل��و افرت�س��ت اأن��ك وكي��ل �س��فر واأردت تنظي��م حمل��ة ترويجي��ة لل�س��ياحة للعام 2023
تعريف امل�سكلة
جمع البيانات
حتديد الأهداف
يف اململك��ة العربي��ة ال�س��عودية ،فم��ن املُه��م يف ه��ذه احلال��ة معرف��ة ع��دد الرح��الت ال�سياحية التي متت خالل العام ،2019وبن ًاء على ذلك �ست�ستطيع حتديد الطرق والو�سائل التي ميكن ال�ستعانة بها جلذب املزيد من ال�سياح يف العام .2023
�س��يتم احل�س��ول عل��ى بيان��ات الرح��الت ال�س��ياحية ال�س��هرية املطلوب��ة لع��ام 2019
من �سفحة بيانات ال�س��ياحة التابعة لوزارة ال�س��ياحة ال�س��عودية يف البوابة الوطنية للبيانات املفتوحة (.)https://data.gov.sa
انطالق ًا من حقيقة اأنه يف العام 2019و�سل عدد الرحالت ال�سياحية للمملكة العربية ال�سعودية اإىل ،17,526,000ميكن حتديد الهدف بزيادة هذا العدد اإىل 25,000,000رحلة �سياحية يف العام .2023
يف البداي��ة �س��تقوم بتقيي��م بيان��ات الرح��الت ال�س��ياحية ال�س��هرية لع��ام 2019
حتديد املتغريات املتاأثرة
186
لتحدي��د نق��اط ال�سع��ف اأو الإ�س��كاليات الكامن��ة يف البيان��ات املتعلق��ة بكل �س��هر من �سهور هذا العام ،وبنا ًء على هذا التقييم الأويل� ،ستُحدد املتغري الذي يجب تغيريه من اأجل حتقيق الهدف ،ثم بن ًاء على النتائج �س�تُقرر ما اإذا كان يجب تنفيذ اأداة �س��ولفر بقي��ود اأم ل.
اأداة اإك�سل �سولفر االإ�سافية
The Excel Solver Add-In
الآن وبعد �سياغة امل�سكلة ب�سكل جيد ،ميكنك فتح برنامج اإك�سل وت�سغيل اأداة اإك�سل �سولفر .يجب عليك ا ًأول تن�سيط هذه الأداة من نافذة خيارات اإك�سل ( ،)Excel Optionsلأنه ل يتم تن�سيطها تلقائ ًيا عند تثبيت مايكرو�س�فت اأوفي�س (.)Microsoft Office لتن�سيط اأداة اإك�سل �سولفر االإ�سافية (:)Excel Solver Add-In من عالمة تبويب ملف ( ،)Fileا�سغط على خيارات (1 .)Options من نافذة خيارات ،)Excel Options( Excelا�سغط على ال�ظائف االإ�سافية (2 .)Add-Ins من مربع اإدارة ( ،)Manageاخرت وظائف Excelاالإ�سافية ( 3 ،)Excel Add-Insثم ا�سغط انتقال (.)GO من نافذة ال�ظائف االإ�سافية ( ،)Add-Insحدِّ د ( Solver Add-Inالأداة الإ�سافية �سولفر)5 . ا�سغط على م�افق (6 .)OK �ستظهر اأيقونة اأداة �( Solverسولفر)7 .
4
1
187
6 5
2
3 4
7
عدد الرحالت ال�سياحية ال�افدة للمملكة العربية ال�سع�دية (مقد ًرا باالآالف).
�سكل :4.27تن�سيط الأداة الإ�سافية اإك�سل �سولفر
188
ا�ستخدام اأداة �سولفر
Using Solver
علي��ك قب��ل كل �س��يء ح�س��اب الع��دد الإجم��ايل للرح��الت ال�س��ياحية لع��ام ( 2019مق��د ًرا ب��الآلف) ،وللقي��ام بذلك �ست�س��تخدم دالة اجلمع ( )SUMيف اإك�سل ،حيث �ستقوم بتحديد واإيجاد جمموع اخلاليا التي حتتوي على اأعداد الرحالت ال�سياحية ال�سهرية. حل�ساب عدد الرحالت االإجمايل: افتح ملف اإك�سل "الرحالت ال�سياحية لعام 1 ."2019 يف اخللية B14اكتب "الإجمايل"2 . يف اخللية C14اكتب "( 3 "=SUM)C2:C13وا�سغط على �سيظهر املجموع الإجمايل يف اخللية4 .
Enter
.
1
4 2
3
�سكل :4.28ح�ساب العدد الإجمايل للرحالت ال�سياحية لعام 2019
189
علي��ك بع��دَ ذل��ك فت��ح مل��ف اإك�س��ل ال��ذي يحت��وي عل��ى بيان��ات الرح��الت ال�س��ياحية لع��ام 2019يف ورق��ة عم��ل باإ�س��م " ،"2019ث��م �ستُن�س��ئ ورق��ة عم��ل جدي��دة با�س��م " "Solverبنف���ص البيان��ات املوج��ودة يف ورق��ة عم��ل "."2019 من املهم القيام باخلطوة املذكورة نظ ًرا لأن ا�ستخدام اأداة �سولفر يوؤدي اإىل تغيري القيم املوجودة يف البيانات ب�سكل دائم وبدون خيار للرتاجع، لذل��ك علي��ك الحتف��اظ بورق��ة عم��ل البيان��ات الأ�سلي��ة (الورق��ة " "2019يف ه��ذا املث��ال) ،ل�س��تخدامها من جديد يف حالة كانت نتائج اأداة �س��ولفر غري ُمر�سية. اإن اأ�سهل طريقة لن�سخ القيم املوجودة يف ورقة العمل " "2019هي باإن�ساء ن�سخة من الورقة نف�سها. لن�سخ ورقة عمل يف اإك�سل: فتح ملف اإك�سل "الرحالت ال�سياحية لعام 1 ."2019 ا�سغ��ط ب��زر الف �اأرة الأمي��ن عل��ى ورق��ة عم��ل " 2 ،"2019وح��دِّ د نق��ل اأو ن�س��خ (3 .)Move or Copy يف ناف��ذة النق��ل اأو الن�س��خ الت��ي �س��تظهر ،ح��دِّ د " 4 "2019ث��م ح��دد خي��ار اإن�ساء ن�سخة (5 .)Create a copy ا�سغط على م�افق (6 .)OK مت اإن�ساء الورقة اجلديدة7 .
1
3
2
4
7 �سكل :4.29ن�سخ ورقة عمل يف اإك�سل
190
5
6
البحث عن اخلاليا ذات االإ�سكاليات الكامنة
Find the problematic cell values
كم��ا ُذك��ر �س��اب ًقا� ،س��يتم تقيي��م بيان��ات الرح��الت ال�س��ياحية ال�س��هرية لع��ام 2019م��ن اأجل اإيج��اد القيم ذات الإ�س��كاليات (اإن ُوجدت) ،ثم حتديد املتغ��ريات الت��ي حتت��اج اإىل تعدي��ل لتحقي��ق اله��دف املن�س��ود .يت��م تعري��ف ه��ذه القي��م يف ه��ذا املث��ال بالقي��م الت��ي حتت��وي عل��ى العدد الأق��ل للرحالت ال�سياحية .اإذا األقيت نظرة فاح�سة على ورقة عمل اإك�سل "� ،"2019ستُالحظ اأن عدد الرحالت ال�سياحية ال�سهرية لالأ�سهر يونيو ويوليو و�سبتمرب ه��ي اأق��ل بكث��ري م��ن تل��ك اخلا�س��ة بال�س��هور الأخ��رى م��ن الع��ام ،لذل��ك من املمك��ن من خالل هذه املالحظ��ة تقدمي القرتاح بالعمل عل��ى زيادة عدد الرحالت ال�سياحية يف اأ�سهر يونيو ويوليو و�سبتمرب ،ولي�ص يف جميع اأ�سهر العام. عام��الت اأداة �س��ولفر� ،س��تكون اخللي��ة اله��دف ( )Objective Cellه��ي اإجم��ايل ع��دد الرح��الت ال�س��ياحية ،و�س��تكون خالي��ا املتغ��ري ه��ي اأع��داد يف ُم ِ الرحالت ال�س��ياحية يف الأ�س��هر يونيو ويوليو و�س��بتمرب ،ولن يتم اإ�سافة قيود حمددة ،و�س��يتم تعيني قيمة خلية الهدف اإىل .25,000,000 ال�ستخدام اأداة �سولفر بدون قيود: من عالمة تبويب ( Dataبيانات) 1 ،ا�سغط على زر �( Solverسولفر)2 . يف حقل ( Set Objectiveحتديد الهدف) ،اخرت اخللية 3 .C14 حدد ( Value of: 25000القيمة4 .)25000 : م��ن خي��ار ( By Changing Variable Cellsلتغيــر اخلالي��ا املتغ��رية) اخ��رت اخلالي��ا 5 . C7;C8;C10 (حل)6 . ا�سغط على ِ Solve يف نافذة ( Solver Resultsنتائج �سولفر) ،ا�سغط على ( OKموافق)7 . �ستُط َّبق التغيريات على اخلاليا املحددة8 . 1 2
ينخف�س عدد الرحالت ال�سياحية ال�سهرية ب�سكل ملح�ظ في اأ�سهر ي�ني� وي�لي� و�سبتمبر ،لذلك �ستحاول زيادة القيم في خاليا C7و C8و C10فقط من اأجل تحقيق الهدف المن�س�د وه� رفع عدد الرحالت ال�سياحية على مدار العام.
191
الخاليا المتغيرة ()Variable Cells
هي الخاليا الم�ج�دة في ورقة العمل والتي �ستتغير قي ُمها .هذه هي متغيرات القرار التي �سيتم �سبطها بهدف ال��س�ل اإلى الحل االأمثل.
الخلية الهدف ( )Objective Cellهي الخلية ال ُم�ستهدفة في ورقة عملك ،والتي يجب زيادة اأو خف�س قيمتها ،اأو تحديدها بقيمة معينة .هذه هي الخلية التي تحت�ي على الدالة الهدف (ال�سيغة).
يمكنك اإ�سافة قيود ()Constraints
3
في هذه القائمة ،وهي الحدود التي تفر�سها على تغييرات القيم في خاليا معينة.
4 5
6
8 7
�سكل :4.30ا�ستخدم اأداة �سولفر بدون قيود
192
تقييم النتائج
Assess the results
الآن وبع��د اأن قم��ت بتنفي��ذ اأداة �س��ولفر ،اأ�سبح��ت جاه��زً ا لإلق��اء نظ��رة عل��ى نتائجه��ا .كم��ا مت��ت الإ�س��ارة اإليه يف بداية الدر���ص ،فاإن نتائج اأداة �س��ولفر لي�س��ت جم��رد اأرق��ام ،ب��ل ه��ي قي��م ذات معن��ى خم�س���ص ملوق��ف الدرا�س��ة املح��دد ،وب�سفت��ك ع��امل بيان��ات ،علي��ك تقييم هذه النتائج لتحديد اجلدوى من القيام باملزيد من الإجراءات .اأو ًل� ،ستُن�سئ يف ورقة عمل �سولفر جدو ًل يت�سمن خم�سة اأعمدة وهي :الرقم الت�سل�س��لي ،ال�س��هر ،الرح��الت ال�س��ياحية ال�س��هرية ،2019نتائ��ج Solverلع��ام ،2023والخت��الف ،وبع��د ذل��ك �س��تقوم باإج��راء املقارن��ة ب�س��هولة قبل تطبيق اأداة �س��ولفر وبعد تطبيقها. حل�ساب االختالف: ان�سخ قيم اخلاليا C1:C14يف ورقة العمل "1 ."2019 يف ورقة عمل " ،"Solverحدِّ د العمود 2 ،Dوا�سغط عليه بزر الفاأرة الأمين. األ�سق القيم التي ن�سختها3 . َغ ِ ّري اأ�سماء الأعمدة واحذف الن�ص " "2019من جميع اأ�سهر العمود 4 .B اأ�سف عمودًا با�سم "الختالف"5 . اكتب يف اخللية E2ال�سيغة "6 ."=C2-D2 ن ِّفذ الدالة يف جميع اخلاليا من E2اإىل 7 ،E14ثم ا�سغط على زر . Enter اأ�سبحت ورقة " "Solverجاهزة الآن لتقييم النتائج8 .
2
3
1
193
4 5
6
194
7
8
�سكل :4.31ح�ساب الختالف
195
�ستقوم الآن باإلقاء نظرة على ورقة العمل وتقييم النتائج ،و�ستالحظ فو ًرا اأن قيم اأداة �سولفر لأ�سهر يونيو ويوليو و�سبتمرب مرتفعة للغاية. اقرتاح��ا ميك��ن �سياغت��ه كالت��ايل :اإذا اأردت الو�س��ول اإىل ه��دف 25,000,000رحل��ة �س��ياحية يف الع��ام ،2023 ُيق��دِّ م لن��ا اإك�س��ل �س��ولفر ً علي��ك القي��ام بحم��الت ترويجي��ة لل�س��ياحة لي�س��ل ع��دد الرح��الت ال�س��ياحية اإىل 4,327,000رحل��ة يف �س��هر يوني��و ،و 3,109,000رحل��ة يف �سهر يوليو ،واأخ ًريا 2,327,000رحلة يف �سهر �سبتمرب .وا�ستنادًا اإىل اأعداد الرحالت يف ال�سهور الأخرىُ ،ي َعد هذا هد ًفا غري واقعي، حي��ث اأن اأعل��ى قيم��ة لع��دد الرح��الت يف الع��ام 2019كان��ت 2,675,000رحل��ة �س��ياحية ،مم��ا يعن��ي اأن��ه مهم��ا كان��ت احلمل��ة الرتويجي��ة التي �ستنفذها ناجحة ،فاإنها لن ت�سل اإىل الهدف املقرتح وهو 4,327,000رحلة يف �سهر يونيو ،حيث اأن ذلك الرقم اأعلى بن�سبة 160% م��ن ع��دد الرح��الت الت��ي مت ت�س��جيلها يف اأف�س��ل �س��هر يف الع��ام ،2019كم��ا ه��و ّ مو�س��ح يف ال�س��كل .4.32
عدد الرحالت ال�سياحية الأ�سهر ي�ني� وي�لي� و�سبتمبر التي تم اإن�ساوؤها ب�ا�سطة اأداة �س�لفر مرتفع ج ًد ا مقارن ًة باأعداد الرحالت في جميع ال�سه�ر االأخرى.
�سكل :4.32عدد الرحالت ال�سياحية لعام 2019والبيانات بعد تطبيق اأداة �سولفر
عدد الرحالت ال�سياحية الأ�سهر ي�ني� وي�لي� و�سبتمبر .2019
ولأن النتائج الأولية بعد تطبيق اأداة �س��ولفر يف املثال ال�س��ابق لي�س��ت واقعية ،يتعني عليك تنفيذ ت�س��غيل اأداة �س��ولفر من جديد ،ولكن مع حتديد بع�ص القيود لأجل احل�سول على اأهداف اأكرث واقعية .على �سبيل املثال ،ميكنك �سبط اأداة �سولفر حل�ساب القيم دون قيد جلميع ال�سهور با�ستثناء اأ�سهر يونيو ويوليو و�سبتمرب ،والتي يجب تعيني قيد لقيمها لتج ُّنب احل�سول على نتائج غري واقعية ،وميكن حتقيق ذلك با�س��تخدام متو�س��ط قي��م البيان��ات املوج��ودة� .ست�س��مح لأداة �س��ولفر بح�س��اب القي��م جلمي��ع ال�س��هور ،ولك��ن باإ�سافة قيود ُحت��دد اأن الأعداد امل�ستهدفة لأ�سهر يونيو ويوليو و�سبتمرب يجب اأن تكون اأعلى من املتو�سط ال�سهري للعام .2019 للعم��ل عل��ى مل��ف اإك�س��ل نف�س��ه� ،ستُن�س��ئ ن�س��خة اأخ��رى م��ن ورق��ة العم��ل " "2019با�س��م "( "Solver )constraintsو�س��تقوم بت�س��غيل اأداة �س��ولفر م��رة اأخ��رى ،ولكن هذه املرة بقيود.
196
ح�ساب املتو�سط
Calculate the average
يتم ح�س��اب املت��س��ط ( )Averageاأو ما ي�س��مى بال��س��ط احل�س��ابي ( )Arithmetic meanملجموعة من الأرقام بجمعها ثم ق�س��مة الناجت على عدد هذه الأرقام .يف احلالة التالية� ،س��تجمع اإجمايل عدد الرحالت ال�سياحية ال�سهرية ثم تق�سم الناجت على .12 حل�ساب املتو�سط: يف مل��ف اإك�س��ل جدي��د ،اأن�س��ئ ورق��ة عم��ل جدي��دة واأطل��ق عليه��ا ا�س��م "(1 ."Solver )constraints يف اخللية ،B15اكتب "املتو�سط"2 . يف اخللية ،C15اكتب ال�سيغة "(3 ."=average)C2:C13 ا�سغط على الزر Enter و�سيظهر املتو�سط يف اخللية 4 .C15
4
ال��سط احل�سابي: يت��م ح�س��اب املُع � َّدل يف الإح�س��اء الو�سف��ي ع��ن طري��ق جم��ع النتائ��ج م ًع��ا ثم ق�س��مة الإجم��ايل على عدد ه��ذه النتائج.
3
2
1 �سكل :4.33ح�ساب املتو�سط
197
ا�ستخدام اأداة �سولفر مع قيود
Solver with constraints
الآن وبع��د اأن ح�س��بت املتو�س��ط ال�س��هري لع��دد الرح��الت ال�س��ياحية لع��ام � ،2019ست�س��تخدم اأداة �س��ولفر عامالت اأداة �سولفر هي اإجمايل عدد الرحالت ال�سياحية، من جديد بقيود ،بحيث تكون اخللية الهدف يف ُم ِ و�س��تكون اخلاليا املتغرية هي اأعداد الرحالت ال�س��ياحية جلميع ال�س��هور� .س��تتم اإ�سافة قيود حمددة ،مع تعي��ني القي��م املق��درة لأداة �س��ولفر لأ�س��هر يوني��و ويولي��و و�س��بتمرب لتك��ون اأك��رب م��ن اأو ت�س��اوي متو�س��ط عدد الرحالت يف العام 2019وهو 1,460,000األف رحلة �سياحية .واأخ ًريا� ،سيتم تعيني قيمة اخللية الهدف مر ًة اأخرى اإىل .25,000,000 ال�ستخدام اأداة �سولفر بقيود: من عالمة تبويب ( Dataبيانات) 1 ،ا�سغط على �( Solverسولفر)2 . من حقل ( Set Objectiveتعيني الهدف) اخرت اخللية 3 .C14 اخرت ( Value of: 25000القيمة4 .)25000: من ( By Changing Variable Cellsلتغيري خاليا املتغري) ،حدِّ د اخلاليا 5 .C2:C13 ا�سغط على ( Addاإ�سافة) لإ�سافة قيد6 .
القيد (:)Constraint القي��د ه��و حتدي��د مع��ني مل��ا ُميك��ن ت�سمين��ه يف جمموع��ة البيان��ات اأو البيان��ات الو�سفي��ة ،اأو حتدي��د ملجموع��ة م��ن مفاتي��ح البيان��ات التي ميكن اإرفاق �سمات معينة بها ُ (وحتدد بوا�سطة هيكل البيانات).
1 2
3 4 5 6
�سكل :4.34ا�ستخدم اأداة �سولفر بقيود
198
الإعداد القيود: من مربع ( Cell referenceمرجع اخللية) ،حدِّ د اخللية 1 .C7 اخرت الرمز