– استخراج البيانات Twitter

يوميا اكثر من 140 مليون مستخدم خدمة رسمية للمدونات الصغيرة لنا Twitter تولد 340 مليون جماعى الرسائل النصية الصغيرة. وهذا عدد كبير من البيانات مع الكثير من انماط مخباة به. ولكن يمكن التنبؤ بما اذا كانت هذه البيانات ارتفاع الاسهم لاعلى او لاسفل?

اعتقد ان وسائل الاعلام, عبر الانترنت او خارجه, تستطيع التاثير على السوق المالى الجيد والردئ. ويقال ايضا ان المستثمرين لا تخضع الا الشعور المقالات الاخبارية ذات الصلة وانما ايضا الراى العام.

ويتمثل التحدى فى كيفية تحديد حجم هذه المعلومات العاطفية التنبؤ بحركة سوق الاسهم حتى يقول الباحثون الذين زرعوا الالغام فى twitter البيانات.

وبعبارة اخرى, فان الرذاذ مشكلة مهمة فى حديث للتمويل هو ايجاد سبل فعالة تلخيص تصور بيانات البورصة الى منح الافراد (مثل التجار) معلومات مفيدة عن سلوك سوق الاسهم لقرارات الاستثمار.

استخراج البياناتTwitter - Data Mining the Stock Market

والتنقيب عن البيانات البورصة هو العلم والتكنولوجيا استكشاف البيانات من اجل اكتشاف بعض انماط غير معروف. هذا هو جزء مما يسمى المعرفة فى قواعد البيانات (ديسكفرى تنقيب فى البيانات). فى العالم اليوم والتى تدار بالحاسوب قواعد البيانات هذه تحتوى على كميات ضخمة من المعلومات بشان اى موضوع يمكنك التفكير فى حالة موضوعنا تويتر. الشئ الثابت هو انتزاع المعلومات المطلوبة من هذه البيانات بنش.

وتجرى البحوث نظم التعدين البيانات التالية:

  1. تطبيق مخطط تسلسل القرارات فى سوق الاسهم
  2. تطبيق شبكات عصبونية فى البورصة
  3. تطبيق النمط المتبع فى البورصة
  4. تطبيق ربط قواعد البورصة
  5. تطبيق التحليل العاملى فى البورصة
  6. تطبيق السلاسل الزمنية فى سوق الاسهم

قرار الاشجار dicision قوة وشعبية من اجل صنع القرار. استخراج البيانات شجرة dicision لاخذ نموذج يمكن استخدامها لتمثيل كلا التصنيف ولمديرى ونماذج التراجع. بينما الكثير من المعلومات التى يلزم مراعاتها هذه الادوات ممتاز ماليا او عدد القرارات.
فىشبكات عصبونية هى تقنية حاسوبية يستفيد من التقنيات التى تستخدم فى مخ الانسان وبالتالى العصبية. ومن المزايا الرئيسية التى تقارب اى وظيفة الخطى درجة accurancy تعسفيا مع وجود عدد كاف من وحدات خفية نتائج هذا الاسلوب ان للاستراتيجيات التجارية تسترشد النماذج توليد للمخاطر اعلى الارباح استراتيجية شراء باستمرار.
تجميع اداة يحل مشاكل التصنيف. ولا سيما ان هذه الطريقة مفيدة لايجاد داخل اى مؤشر البورصة, مجموعات من الشركات المشاركة فى سلوك مماثل الزمنية ولهذا الغرض وتجميع لحل هذه المشكلة تمثل استراتيجية جيدة.
قواعد الرابطة شهير وطريقة البحث لاكتشاف العلاقات بين المتغيرات الهامة فى قواعد البيانات الكبيرة. محسن قواعد الرابطة uninstantiated يسمح attrubutes لاحتواء المشكلة لتحديد هذه instantiations اما دعم او الثقة اذا حكم الى اقصى حد ممكن.
التحليل العاملى غالبا فى الحالات التى عدد كبير من المتغيرات يعتقد ان تحدد عدد قليل نسبيا من الاسباب الشائعة التباين
الواضح.السلاسل الزمنية التنبؤ بالزلازل, وان تقوم بدور هام فى حياتنا اليومية. السلاسل الزمنية التقليدية تتطلب مزيدا من البيانات التاريخية مع بعض الافتراضات مثل طبيعتها المعطيات. بيانات السلاسل الزمنية بانها كبيرة فى حجم البيانات عالية dimensionally وتحديث باستمرار. ولهذا السبب بيانات السلاسل الزمنية تعتبر دائما “الفرد” بدلا من الحقول الرقمية.

لا نريد فقط للتنبؤ البورصة باستخدام هذه المعلومات ايضا اطارا زمنيا ينبغى تطبيقها على تلك المعلومات. تاجر يجب ان تستفيد من انماط رقيقة جدا قصيرة العمر, وادماج الاسواق اللاعبين فى السوق اوجه الاتساق.

الختام

هناك حاجة ماسة الى نهج الالى من الفعالية والكفاءة فى استخدام البيانات المالية لدعم الشركات وفرادى التجار فى التخطيط الاستراتيجى اتخاذ قرارات الاستثمار.

ويبقى السؤال هو:

اذا استطعنا التنبؤ السوق المالى. هل سيظل هناك سوق مالى? عندما يعرف كل التجار ما سيقوم به السوق ما مصلحة هناك? وربما الاهم من ذلك, ما زال التجارى متعة واثارة? شارك برايك او ربما التجربة فى التعليقات ادناه. انا فضولى جدا جدا!

Twitter – استخراج البيانات البورصة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

What is 12 + 14 ?
Please leave these two fields as-is:
IMPORTANT! To be able to proceed, you need to solve the following simple math (so we know that you are a human) :-)