R-Bloggers

ساخت وبلاگ

اخبار و آموزش های R توسط صدها وبلاگ نویس R

تشخیص الگوی کمی شمعدان (HMM ، Baum Welch و همه آن)

ارسال شده در 10 ژوئن 2010 توسط تجارت هوشمند در وبلاگ نویسان R |0 نظر

[این مقاله برای اولین بار در تجارت هوشمند منتشر شد و با مهربانی به R-Bloggers کمک کرد].(می توانید در مورد محتوای این صفحه در اینجا شماره را گزارش دهید) آیا می خواهید محتوای خود را در R-Bloggers به اشتراک بگذارید؟اگر یک وبلاگ دارید ، اینجا را کلیک کنید ، یا اگر این کار را نمی کنید اینجا.

شکل 1. رویکرد مبتنی بر خوشه بندی به تشخیص الگوی شمعدان.

من در حال خواندن کتابی با عنوان "Quants" هستم که مطمئن هستم بسیاری از بازرگانان را با برخی از ایده های تعبیه شده در درون خود قرار می دهم. مهمترین آنها (IMO) ، این تصور که جیمز سیمونز رنسانس ، باتری رمزنگاری و کارشناسان تشخیص گفتار را برای رمزگشایی کد بازارها استخدام کرد. مهمترین آنها از متخصصان استخدام شده ، لئونارد باوم ، توسعه دهنده الگوریتم Baum-Welch بود. الگوریتمی که برای مدل سازی مدل های مخفی مارکوف استفاده می شود. اکنون در حالی که من قصد ندارم جزئیات کامل کار خودم را در این زمینه تقسیم کنم. من می خواهم نمونه مختصری از برخی از روش ها برای استفاده از این ایده ها ارائه دهم.

در حال حاضر بیشتر پزشکان کلاسیک TA ادبیات عظیمی را در مورد شمعدان ها ایجاد کرده اند ، نمادهای ژاپنی که برای نشان دادن یک شکل گیری نمادین در اطراف داده های روزانه باز ، بالا ، پایین و نزدیک استفاده می شوند. مشکل همانطور که من می بینم ، این است که بیشتر ادبیاتی که در دسترس است فقط به شناخت کیفی الگوها می پردازد ، نه کمی.

ما ممکن است بخواهیم از یک رویکرد کمی تر برای تجزیه و تحلیل اطلاعات استفاده کنیم ، زیرا این امر پتانسیل بیشتری نسبت به داده های قیمت بسته بندی دارد (یعنی اطلاعات موجود در هر شمع حاوی چهار بعد اطلاعات است). سوال این است که ، چگونه این کار را به روشی کمی انجام دهیم؟

یک روش برای شناخت الگوهای شناخته شده ، روش نظارت شده است. در یادگیری تحت نظارت ، ما به یادگیرنده لیست صحیحی از پاسخ ها را برای یادگیری و پیکربندی خود از آن تغذیه می کنیم. در بسیاری از تکرارها ، بهینه ترین پیکربندی برای به حداقل رساندن خطاها بین داده هایی که یاد می گیرد و داده هایی که ما به عنوان نمونه از آنها تغذیه می کنیم ، به حداقل می رسد. به عنوان مثال ، ما ممکن است به مجموعه ای از شخصیت های دست نوشته نگاه کنیم و یک جعبه سیاه بسازیم تا هر نامه را با آموزش از طریق یک شبکه عصبی ، دستگاه بردار پشتیبانی یا سایر دستگاه های یادگیری نظارت شده بشناسیم. با این حال ، شما احتمالاً نمی خواهید ساعت ها برای طبقه بندی انواع شمعدان ها با نام خود صرف کنید. کسانی که با شمعدان آشنا هستند ، ممکن است نمادهای مختلف متعددی را تشخیص دهند. ستاره تیراندازی ، چکش ، داجی و غیره ... هر یک از یک گنگ نمادین منحصر به فرد از آینده را نشان می دهد. از منظر کمی ، ما ممکن است بیشتر علاقه مند به درک دیدگاه بیزی باشیم. یعنیبه عنوان مثال P (Upday | Hammer) = P (Upday ، Hammer)/P (Hammer).

اما چگونه می توانیم بدون استفاده از روش خسته کننده برای شناسایی هر یک از نمادهای فردی با دست ، قسمت نمادها را بیاموزیم؟این مشکلی است که بهتر است با یادگیری بدون نظارت به آن نزدیک شود. در یادگیری بدون نظارت ، ما نیازی به آموزش یک یادگیرنده نداریم. این روابط به خودی خود پیدا می کند. به طور معمول ، روابط به عنوان تابعی از فاصله بین نمونه ها برقرار می شود. لطفاً به منظور بررسی مفاهیم با جزئیات بیشتر ، متن داده کاوی (Witten/Frank) را در لیست توصیه شده من مشاهده کنید. در این حالت ، من قصد دارم با استفاده از یک یادگیرنده بسیار تحت نظارت بسیار متداول به نام خوشه بندی K-Means تمرین کنم.

شکل 2. نمودار پنجره دلخواه داده های QQQQ

توجه داشته باشید که فرم شمعدان شمعدان سفارش داده شده در زمان معمول در شکل 2 نمایش داده می شود. اکنون با استفاده از خوشه بندی K- معنی ، با هدف شناسایی 6 خوشه ، سعی کردم به طور خودکار 6 فرم شمعدان منحصر به فرد را بر اساس داده های H ، L ، Cl نسبت به باز کردن یاد بگیرمدر این مثالاین ایده که آرکیپت های شمعدانی مشابه تمایل دارند از راه دور خوشه ای کنند.

شکل 3. نمادهای شمعدانی طبقه بندی شده توسط 6 خوشه

در شکل 3 توجه کنید که ما به وضوح می توانیم رویکرد خوشه بندی K-Means را به طور خودکار بدنهای قرمز بزرگ ، بدنهای سبز و حتی جالب تر ببینیم ، برتری چکش ها وجود دارد که به طور خودکار در خوشه شماره 5 شناخته می شوند.

بنابراین با توجه به اینکه ما یک قطعه از 6 نماد را در زبان خود شناسایی کرده ایم ، از این چه کاربردی می تواند باشد؟خوب ، ما می توانیم با استفاده از برنامه ای مانند R. ، جدول بندی متقاطع حالتهای نماد خود را انجام دهیم و اجرا کنیم

شکل 4. جدول بندی متقاطع حالتهای خوشه ای.

یکی از مواردی که بلافاصله به من اعتصاب می کند این است که تعداد زیادی از ایالت های 1 ایالت زیر 5 ایالت وجود دارد. توجه کنید که فرکانس 57 ٪ همه حالتهای وابسته دیگر را نشان می دهد. حالا چه چیزی در این مورد جالب است؟به یاد داشته باشید که ما مشخص کردیم که ایالت 5 با شمعدان چکش مطابقت دارد؟خوب ، شهود مشترک (حداقل از سالهای خواندن من) انتظار دارد که چکش نقطه عطفی باشد که با یک حرکت بالا به دنبال آن است. با این حال ، در جدول ما می بینیم که به طرز چشمگیری از حالت 1 دنبال می شود ، که اگر به عقب نگاه کنید ، در طبقه بندی شده توسط نمودار خوشه ای ، یک شمعدان قرمز بسیار بزرگ است. این کاملاً بر خلاف آنچه که بدن مشترک دانش و شهود ما به ما می گوید است.

در صورتی که ممکن است برای فاتوم باورنکردنی به نظر برسد ، می توانیم دوباره داده ها را متوسل کنیم ، این بار به ترتیب زمان اصلی ، اما با خوشه های مشخص شده.

شکل 5. بازرسی بصری Hammer (State5) احتمالاً توسط شمع پایین (حالت 1) دنبال می شود

ما می توانیم به عقب برگردیم و داده ها را متوسل کنیم و حالتها را از طریق سطح پله شناسه خوشه ای متفرقه (5) شناسایی کنیم ، یا از برچسب ها استفاده کنیم تا به سادگی مورد چکش (5) و نماد زیر آن را مشخص کنیم. توجه کنید که برخلاف دانش مشترک ، فرآیند تشخیص خودکار ما و ماتریس احتمال جدول بندی شده ، با بازرسی بصری ما تأیید خوبی پیدا کرده است. در نمونه پنجره ساده (تغییر اندازه برای بهبود دید) ، 4 مورد از 5 نمونه چکش (حالت 5) توسط یک شمع بزرگ قرمز قرمز (حالت 1) دنبال شد. اکنون یک اظهار نظر دیگر این است که در صورتی که ایالت 5 توسط ایالت 1 دنبال نشود (مثلاً ما انتظار داریم که یک حرکت پایین داشته باشیم) ، این احتمال 14. 3 ٪ احتمال فرود در ایالت 6 را در حرکت بعدی دارد ، که ما را به ارمغان می آورد. احتمال حرکت به اندازه مناسب به طور کلی به 71. 4 ٪ در کل.

ما می توانیم این ایده های کمی ساده را بگیریم و آنها را به مدل های پویا MCMC ، الگوریتم های Baum Welch و Viterbi و همه چیزهای پیچیده گسترش دهیم. شاید روزی حتی از خود رنسانس قدرتمند تقلید کند؟من نمی دانم ، اما هر لبه ای که می توانیم به زرادخانه خود اضافه کنیم مطمئناً کمک خواهد کرد.

اگر می خواهید دیدگاه بسیار خوبی در مورد بسیاری از رویکردهای مربوط به مقدار زیادی داشته باشید ، مدتی را برای خواندن Quants اختصاص دهید.

ممکن است در این پست اشکالاتی وجود داشته باشد ، زیرا به نظر می رسید Google پلت فرم ویرایش خود را به روز می کند ، و من سعی می کنم برخی از کنگرها را از بین ببرم.

آشنایی با رمزارزها...
ما را در سایت آشنایی با رمزارزها دنبال می کنید

برچسب : نویسنده : بهاءالدین خرمشاهی بازدید : 44 تاريخ : يکشنبه 6 فروردين 1402 ساعت: 12:53