Kenneth Cukier: Big data is better data



المترجم: Abd Al-Rahman Al-Azhurry
المدقّق: Ayman Mahmoud ما هي الفطيرة المفضلة عند الشعب الأمريكي؟ الجمهور: فطيرة التفاح.
كينيث كوكير: فطيرة التفاح، بالطبع. كيف عرفنا ذلك؟ طبعاً بفضل البيانات. ألقوا نظرة على مبيعات مراكز التسوق الكبرى. انظروا الى مبيعات الفطائر
المثلجة بحجم ٣٠ سنتيمتر تحتل فطيرة التفاح القمة بدون منازع. أغلبية المبيعات من منتجات التفاح. لكن فيما بعد، اتجهت هذه المراكز إلى بيع فطائر أصغر حجماً بحجم 11 سنتيمتر وفجأة تراجعت منتجات التفاح
إلى المرتبة الرابعة أو الخامسة لماذا؟ ماذا حدث؟ حسنا، لنفكر في الأمر. عندما تشتري فطيرة بقياس 30 سنتمتر، يجب أن تجمع كل الأسرة على نفس الاختيار، والتفاح
هو الخيار المفضل الثاني عند الجميع. (ضحك) لكن عندما تشتري فطائر
بقياس 11 سنتمتر فردية، يمكنك شراء ما تفضله أنت. أي يمكنك أن تشتري اختيارك المفضل. بهذا تملك بيانات أكثر. بإمكانك رؤية أمور لم تكن تراها في السابق حين كان لديك كمية أقل من البيانات. المقصود بهذا هو أن كثرة البيانات لا تسمح لنا فقط برؤية أشياء أكثر عن ما نراه. بل أكثر من ذلك، فهي تعطينا رؤية جديدة. تعطينا رؤية أفضل. تعطينا منظوراً مختلفاً للأمور. و في هذه الحالة، تمكننا من معرفة
نوع الفطائر المفضلة عند الأمريكيين: وهي ليست فطائر التفاح. أظن أن الجميع هنا قد
سمعوا بمصطلح "البيانات الضخمة" أظنكم قد سئمتم من سماع مصطلح
"البيانات الضخمة" صحيح أنه أثار ضجة كبيرة كمصطلح، وهذا أمرٌ مؤسف، لأن البيانات الضخمة تعد أداةً مهمةً جداً لمساعدة المجتمع على التقدم. ففي السابق،
اعتدنا على رؤية بياناتٍ محدودةٍ ومحاولة فهم معناها في سبيل فهم العالم من خلالها، أما الآن فلدينا فائض منها، أكثر من السابق بكثير. اكتشفنا أنه عند امتلاكنا بيانات ضخمة، يمكننا القيام بأمور لم يكن بإمكاننا
القيام بها عندما كانت البيانات أقل. فالبيانات الضخمة مهمة وحديثة العهد، و عندما تفكر في هذا الأمر ستجد بأنها الوسيلة الوحيدة التي ستمكن
كوكبنا من التعامل مع تحدياته العالمية. لتغذية الناس وإمدادهم بالعناية الطبية، و إمدادهم بالطاقة والكهرباء، و حمايتهم من الدمار الشامل
بسبب الاحتباس الحراري. وهذا بفضل الاستخدام الفعال للبيانات. إذا ما الجديد في البيانات الضخمة؟
ما الأمر المهم؟ حسنا، للإجابة لهذا السؤال، دعونا نشاهد الشكل الذي اتخذته المعلومات، ظاهرياً في الماضي. في 1908 في جزيرة كريت اكتشف علماء الآثار قرص من طين. يعود تاريخه الى 2000 قبل الميلاد.
يبلغ عمره 4000 سنة. توجد هناك نقوش على هذا القرص لكننا لا نعرف معناها بعد. الأمر يشوبه غموض تام، لكن المهم هو ان المعلومات كانت على هذا الشكل منذ 4000 سنة. هكذا كان يوثق المجتمع وينقل المعلومات. أما الآن، فلم تتقدم المجتمعات كثيراً فما زلنا نخزن المعلومات على الأقراص، لكن حالياً يمكننا أن نخزن كماً أكبر
من المعلومات، أكثر من قبل. البحث والنسخ صارا أسهل. و كذلك المشاركة والمعالجة. باستطاعتنا إعادة استخدام هذه المعلومات لاستعمالات لم نكن نتخيلها عندما كنا نجمع المعلومات لأول مرة. في هذه الحالة، انتقلت البيانات من التخزين إلى تدفق للمعلومات، من شيءٍ جامدٍ وراكد، إلى آخر سلسٍ ومتحرك. بل و يمكننا أن نصف المعلومات بالسيولة. فالقرص الذي اكتُشف في كريت والذي يبلغ عمره 4000 سنة ثقيل، لا يمكنه تخزين كمٍّ كبيرٍ من المعلومات، و هذه المعلومات غير قابلة للتغيير. بالمقابل، فجميع الملفات التي أخذها إدوارد سنودن، من وكالة الأمن القومي في الولايات المتحدة يمكن تخزينها على ذاكرة محمولة، بحجم الإظفر. كما يمكن مشاركة
هذه المعلومات بلمح البصر. الكثير والكثير من البيانات. أحد أسباب وجود هذا الكم من البيانات وهو أننا نخزن أموراً كنا دائماً نجمع معلومات عنها، وسبب آخر لهذا، أننا نأخذ أشياء كانت دوماً مليئة بالمعلومات ولكنها لم تحول إلى صيغة البيانات ومع ذلك نضعها مع البيانات. على سبيل المثال، مسألة المكان. مثلاً مارتن لوثر. لو أننا كنا في القرن السادس عشر
وأردنا معرفة مكان مارتن لوثر كان علينا أن نتعقبه بشكل دائم
و نحن نحمل قلم ودواة حبر ونسجل مكانه، أما اليوم انظروا كيف اختلفت الأمور تعلمون بأنه في مكان ما لعل في قاعدة بيانات شركة اتصالات يوجد هناك مدخل او جدول في قاعدة بيانات التي تسجل معلوماتك حول مكانك في كل وقت اذا كان لديك هاتف خلوي و كان مزودا بنظام تحديد المواقع او لا فيمكنه تسجيل معلوماتك اذن, فقد تم تسجيل معومات مكانك و الآن فكر في وضعيتك وضعية جلوسك الآن كيفية جلوسك الطريفة التي تجلس فيها انت و انت كلها مختلفة بسبب طول قدمك و ظهرك و وضعية ظهرك لو وضعت مئة جهاز استشعار في كل الكراسي الآن لاستطعت رسم مخطط خاص بك و كأنه بصمتك , و لكن ليس بصمة اصبعك اذن ماذا استطيع ان افعل مع هذا؟ يستخدم الباحثون هذه الخاصية في طوكيو كجهاز كامن ضد السرقة في السيارات عندما يجلس السارق خلف المقود و يحاول الانطلاق, عندها تتعرف السيارة على ان الجالس لم يتم التعرف عليه و عندها ينطفئ المحرك الا اذا ادخلت الرقم السري في لوحة القيادة مثلا "مرحبا, لدي الصلاحية في القيادة" ماذا لو كل سيارة في اروبا كانت تمتلك هذه التقنية؟ ماذا كنا نستطيع ان نفعله؟ لو اجمعنا البيانات لاستطعنا ان نتعرف على اشارات المؤشر و يعمل ايضا كافضل جهاز يتوقع حدوث اصطدام في الخمس ثوان المقبلة اذن, ستبين البيانات بأن السائق مرهق و ستفعل الخدمة عندما تستشعر السيارة بأن السائق يبدأ بالارهاق عندها ستفعل نظام الانذار الداخلي التي تبدأ بهز المقود و الصفير اشارة للسائق بأن يستيقظ و ان يراقب الطريق اكثر هذه الأمور التي باستطاعتنا فعله عندما نستجمع معلومات اكثر عن حياتنا اذن, ما هي فائدة هذا الكم من البيانات؟ حسنا, لننظر في الأمر لديك كم اكبر من المعلومات تستطيع فعل امور اكثر من ذي قبل من اكثر المجالات المذهلة التي تعمل فيها هذه الخاصية هو مجال التعلم الآلي التعلم الآلي هو فرع من الذكاء الاصطناعي و الذي في ذاته فرع من علوم الحاسبات بشكل عام تكون الفكرة انه بدل من امر الحاسوب بالعمل ببساطة سندخل معلومات حول المشكلة و نخبر الحاسبة بحل المشكلة بنفسها ستساعدك هذه العملية في فهم المشكلة في النظر في اصلها في الخمسينيات, كان هنالك عالم في الحاسبات في شركة (IBM) يعرف بـ آرثر سامويل كان يحب الشطرنج, فصنع برنامجا يستطيع فيها اللعب ضد الحاسبة لعب ففاز و لعب ففاز و لعب ففاز لأن الحاسبة كانت تعرف الخطوات القانونية في اللعبة ولكن سامويل كان يعرف امرا آخر كان يعرف الاستراتيجية فصنع برنامجا ثانويا مع اللعبة يعمل خلف الكواليس و كل ما كان يفعله هو حساب الاحتمالات انه اي لترتيب في اللعبة سيؤدي الى الفوز ضد الخصم بعد كل حركة في اللعبة لعب ضد الحاسبة ففاز و لعب ففاز و لعب ففاز بعدها ترك الحاسبة لتكون خصم نفسها في اللعبة لعبت ضد نفسها و استجمعت بيانات اكثر اكتسبت بيانات اكثر و زادت في دقة توقعاتها ثم رجع سامويل الى الحاسبة و لعب ضد الحاسبة فخسر و لعب فخسر و لعب فخسر عندها صنع سامويل آلة فاقت قدرته في المهمة التي علمها الى الحاسبة. و بدأت فكرة التعليم الآلي بالتوسع في كل مكان. اذن كيف حصلنا على سيارة ذات السياقة الآلية هل سنكون افضل كمجتمع واحد يعمل على ادخال المعلومات المرورية الى برنامج واحد؟ كلا. هل السبب في الخزن الرخيص؟ كلا. في سرعة الخوارزميات؟ سرعة المعالجات؟ كلا كلها مهمة الا انها ليست السبب. السبب هو اننا غيرنا طبيعة المشكلة. غيرنا طبيعة المشكلة الى صورة نعمل فيها بجهد على تعليم الحاسبة كيفية السياقة في برنامج نقول له: "هذه معلومات حول السيارة" انت اكتشف الأمر لوحدك انت اكتشف اين اشارة المرور. و ان الاشارة حمراء و ليست خضراء و التي تعني التوقف و ليس الحركة. التعليم الآلي هو الأساس لكثير من الأمور التي نفعلها على النت مثل محركات البحث و الخوارزميات المخصصة لموقع آمازون و ترجمة الحاسبة و انظمة التعرف الصوتي. بدأ الباحثون مؤخرا في دراسة التحليلات النسيجية و التحليلات السرطانية و طلبوا من الحاسبة التعرف على النتائج من خلال حساب البيانات و احتمالية الشفاء لتحديد ان كانت فعلا الخلايا سرطانية ام لا. و بالتأكيد عند ادخال البيانات عن طريق خوارزميات في التعليم الآلي استطاعت الحاسبة في التعرف على اثني عشر مؤشرا من التحليل ان هذه الخلايا هي بالفعل خلايا سرطانية. كانت المشكلة ان المعلومات الطبية المتوفرة قد تعرفت على تسعة مؤشرات فقط كانت هناك ثلاث مؤشرات لم يبحثها الأطباء بينما اكتشفتها الحاسبة. بالمقابل, هنالك جانب مظلم للبيانات الكبيرة سوف تحسن طريقة حياتنا, لكن توجد هناك مشكلة يجب الحذر منها. اولها اننا قد نُعاقب لهذه التنبؤات لأن الشرطة قد تستخدم هذه الخاصية في عملها كما في فلم "تقرير الأقلية". يوجد الآن مصطلح يعرف بـ "الأمن التنبؤي" او "خوارزميات علم الجريمة" و الفكرة هي عندما نأخذ مجموعة من البيانات مثلا مكان وقوع الجريمة سوف نعرف اين نرسل الدوريات هذا أمر منطقي, لكن المشكلة هي ان النظام لن يتوقف عند معلومات الموقع و انما يبدأ بالبحث في معلومات الأفراد مثلا المعلومات الشخصية عن الشخص في ايام دراسته في الثانوية لعنا يجب دراسة وضع الشخص ان كان موظفا ام لا, و درجته الائتمانية و طريقة استخدامه للانترنت هل الشخص يبقى مستيقظا لوقت متأخر و معلومات نظامه الصحي و العقلي عندها سيتبين ان الفرد لديه افكار عدوانية. قد تكون لدينا خوارزميات تتنبأ حول ما سنفعله بعد قليل و دراسة النتائج قبل الاقدام على الفعل. كان الخصوصية من اهم التحديات في مجال البيانات المحدودة. اما في عصر البيانات المفتوحة سوف يكون التحدي هو حماية الحرية الفردية و القرارات الفردية و قوة الارادة و الكيان الفردي. توجد هناك مشكلة اخرى. سوف تقوم هذه البيانات الضخمة بسرقة وظائفنا هذه البيانات الى جنب الخوارزميات سوف تقوم بتحدي اعمالنا الاحترافية في القرن الواحد و العشرين بنفس الطريقة التي قامت المصانع و الآليات بتحدي عمال الفحم في القرن العشرين. مثلا عامل فني في مختبر الذي يقوم بالدراسة من خلال النظر عبر المجهر في التحليلات و القرار ان كانت الخلايا سرطانية ام لا. في الواقع قد ذهب هذا الشخص الى الجامعة و قد يمتلك بيتا و يصوت في الانتخابات و قد يكون من اصحاب المصالح في المجتمع فيصبح عمل هذا الشخص و كثيرين من امثاله من المحترفين سوف يجدون ان اعمالهم قد تغيرت كليا او انتهت تماما. و الآن علينا ان نفكر بأن التكنولوجيا سوف تصنع وظائف جديدة خلال فترة زمنية قليلة و التي سوف تمسنا و بعبارة اخرى انها ثورة صناعية اخرى و هذا بالفعل ما حدث. و لكننا نسينا شيئا في هذا التحليل. توجد هناك عدة اصناف من الوظائف التي سوف تنتهي و لن تعود ابدا. لم تكن الثورة الصناعية مثالية في واقعها بانسبة للخيول مثلا. اذن علينا ان نكون اكثر حذرا و علينا ان نستفيد من البيانات بصورة تكمل الحاجات الانسانية علينا ان نكون اسياد هذا التطور و ليس عبيده. نقف الآن على اعتاب هذا العصر المعلوماتي و بصراحة لسنا بارعين في هذا المجال في تصنيف المعلومات التي نحصل عليها. ليت عائقا فقط لوكالة الأمن القومي. يتم جمع كم هائل من البيانات
و لكن لا تُستخدم بصورة صحيحة علينا ان نطور انفسنا في هذا المجال
و هذا يستغرق وقتا يشبه هذا التحدي نفس التحدي الذي واجهه الانسان البدائي مع النار. انها اداة, و لكننا ان استخدمناه بصورة خاطئة سوف تحرقنا. هذه البيانات سوف تغير طريقة معيشتنا و عملنا و طريقة تفكيرنا. سوف تساعدنا في ادارة وظائفنا لنصنع حياة الرضا و الأمل و السعادة و الصحة سابقا كنا ننظر الى تكنولوجيا المعلومات و لم نكن نرى فيها روحا مجرد ادوات و هذا كان الواقع الملموس. اما الآن يجب ان نعيد النظر لنرى الروح و ليس فقط الجسد الذي هو اقل وضوحا و لكن باتأكيد اكثر اهمية. استطاع البشر اخيرا ان يتعلم من المعلومات التي يستجمعها جزءا من التساؤل الأزلي حول مفهوم الحياة و الوجود و لهذا البيانات الكبيرة هي ذات اهمية كبيرة (تصفيق)

28 Comments

  1. Engineer 314 said:

    11:15 about those three traits. Wouldn't scientists want to keep those traits on record in case those traits are correlated with cancer?
    In general, it seems machine learning, or more specifically unsupervised learning, can "outwit" human thinking partly because they take these "unknown" factors into account.

    June 29, 2019
    Reply
  2. April Yan said:

    From the big data, which shows the efficiency can be greatly increased ,we can imagine the picture of a communist society. In the future, job will not be the tool of life but some kind of pleasure that is a necessity for everyone.

    June 29, 2019
    Reply
  3. Read Books said:

    ….. 2030
    parkour ai robots billion times smarter than all humans jumping around.
    Big Data, who knows..

    June 29, 2019
    Reply
  4. Isabella Fernandes said:

    why tf am I so confused

    June 29, 2019
    Reply
  5. Dario Sanchez Martinez said:

    Shared at the speed of light? A few GB still takes my computer hours to download!

    June 29, 2019
    Reply
  6. kenneth Oosting said:

    Big Data magic?: https://www.linkedin.com/pulse/big-data-magic-kenneth-w-oosting/

    June 29, 2019
    Reply
  7. Pikachu said:

    Handling data better is the challenge. Some apps(especially games) ask for location access unnecessarily so you just fix or randomize your location for them while you keep moving because for some apps u really need them to keep track of your location.

    June 29, 2019
    Reply
  8. Translate Entertainment said:

    Did anyone else notice that the emphasis of the word apple at the beginning was to persuade people that Apple may be the Big Data collector to get people to worry about? He's basically saying think before you buy an APPLE DEVICE. APPLE pie sales FELL. APPLE is everyones SECOND favorite. Definitely a strong but rightful bias.

    June 29, 2019
    Reply
  9. fingerhorn4 said:

    "Big data is an extremely important tool" – for corporate schmucks to manipulate people, invade your privacy, influence elections, market worthless products, sell you scams, operate pyramid selling, brainwash you, buy influence, cheat, lie, bullshit you, and profit from you. In short Big Data is just another advertisers low grade tool for high grade manipulation.

    June 29, 2019
    Reply
  10. Shuai Ma said:

    First 3 minutes with full of common sense, it's a TED talk for Christ sake, and my time was not being respected.

    June 29, 2019
    Reply
  11. David Marten said:

    Excellent. Simple and awesome.

    June 29, 2019
    Reply
  12. K-Real said:

    His breathing is so irritatnig

    June 29, 2019
    Reply
  13. Luke Vallence said:

    First year University student and we are learning about big data.. Stumbled across this TED Talk thinking maybe he might have some extra insight into what I am learning. But nope. Seemed rather pointless, just spoke about ideas and what we already know about data haha… Nothing different to the next Joe blow on the street..

    Honestly could have summarised what he said in a three minute powerpoint in-front of my parents and they would have told me I was 5 years late

    June 29, 2019
    Reply
  14. Ahmad Muzakki said:

    he sounds like he's about to cry

    June 29, 2019
    Reply
  15. Ronan Cleary said:

    We will all live in a utopian world where computers will do our jobs and the people will have more time to enjoy life. Karl Marx will finally get what he wanted.

    June 29, 2019
    Reply
  16. Mahyudin Ghazali said:

    Does Big Data will threaten all the Statistic Department of the World because they are still using interviews and online surveys to collect data.

    June 29, 2019
    Reply
  17. sdf p said:

    cant concentrate well on this, he has so yellow teeth.

    June 29, 2019
    Reply
  18. Imtithal Saeed said:

    Just excellant

    June 29, 2019
    Reply
  19. Mike Suopys said:

    ……Datafied….datafied

    June 29, 2019
    Reply
  20. greenspringvalley said:

    When he said "America's favorite pie is what??? …the reason that the audience said "apple" is that the audience was quoting the old slogan….like "you can't drink it slow if it's what?" "QUICK". Yet, in spite of that, the speaker took their answer literally and conclusively. Maybe people buy more apple pies because apples are cheaper, more available keep better than other fruits like peaches, blueberries, and mincemeat. Yet, the speaker instantly concludes that the reason we KNOW this is because of big data. All questions were removed by the big data, or by the speaker's beliefs about big data's ability to answer all questions. All nuances were lost with the question. America's favorite pie is apple in the very humorous and informal sense that our "favorite sport is baseball"…and yet, all sense of fun and nostalgia was lost when the speaker used limited big data "observations" to make the statement absolutely literal. Beans are a magical fruit, the more you eat, the more you ___. How do we know this? Because trains toot and some trains carry beans.

    June 29, 2019
    Reply
  21. Chris DaCosta said:

    I can't handle watching this video. He made my pet peeve list with his mic breathing and spastic right shoulder.

    June 29, 2019
    Reply
  22. Pejman Saberin said:

    there are a lot of talks on TED about big data!!!

    June 29, 2019
    Reply
  23. poonam purohit said:

    wow amazing great great great no words to describe such a topic to me.

    June 29, 2019
    Reply
  24. EnharmonicKey said:

    I keep thinking he's angry at me just by the way he talks lmfao

    June 29, 2019
    Reply
  25. Henri Steenkamp said:

    Big Data is better data — great #TED talk.
    #bigdata

    June 29, 2019
    Reply
  26. Allie Kinghorn said:

    Big Data is more of a culture shift than a concept. Conceptually, it's simple, but in practice, it could open more doors than we can imagine. Great talk, Kenneth Cukier!

    June 29, 2019
    Reply
  27. Daniel Banta said:

    Apple doesn't lose in the smaller pie category because families want to share and it is the flavor of pie that they can all agree on……

    Apple loses the smaller pie category because people are willing to be more adventurous and try a different flavor if they only have to commit to a smaller portion.

    People buy apple in the larger quantity when they want to be sure they are going to enjoy their purchase. 

    June 29, 2019
    Reply
  28. Manthan Shah said:

    wow…this was goooooood!

    June 29, 2019
    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *