10.1 – कौन है X और Y कौन है? 

मुझे उम्मीद है कि पिछले अध्याय से आपको लीनियर इक्वेशन समझ में आ गया होगा। साथ ही यह भी पता चल गया होगा कि किसी दो डेटा समूह के लिए MS Excel का इस्तेमाल कर के लीनियर इक्वेशन कैसे निकाला जा सकता है। याद रखिए कि यहां पर हम दो वेरिएबल की बात कर रहे हैं X और Y

X डिपेंडेंट वेरिएबल है Y डिपेंडेंट वेरिएबल है। आपको समझ में आ ही गया होगा कि X और Y यहां पर दो अलग-अलग स्टॉक हैं। 

तो थोड़ा आगे बढ़ते हैं और दो स्टॉक का लीनियर रिग्रेशन निकालते हैं – HDFC बैंक और ICICI बैंक पर और देखते हैं कि हमें क्या परिणाम मिलता है। 

मैं ICICI को X और HDFC बैंक को Y बना रहा हूं। यहां पर डाटा को लेकर जो बातें ध्यान में रखनी है उन्हें एक बार देख लेते हैं – 

  1. यह ध्यान देना है कि डेटा साफ हो मतलब उसकी कीमत में स्प्लिट, बोनस या ऐसे किसी और कॉरपोरेट एक्शन की वजह से कोई भारी बदलाव नहीं आ रहा हो 
  2. यह भी ध्यान देना है कि डेटा एक समान तारीख का हो मतलब अगर मैंने एक स्टॉक के लिए 4 दिसंबर 2015 से 4 दिसंबर 2017 तक का डेटा लिया है तो दूसरे के लिए भी इन्हीं तारीखों का डेटा होना चाहिए। 

इन दोनों बैंकों का जो डेटा हमने लिया है वो ऐसा है 


अब मैं इन दोनों स्टॉक पर लीनियर रिग्रेशन निकालूंगा। (इसे कैसे निकाला जाता है इस पर हम पिछले अध्याय में चर्चा कर चुके हैं)। ये भी ध्यान रहे कि यहां हम स्टॉक की कीमत पर लीनियर रिग्रेशन निकाल रहे हैं, स्टॉक के रिटर्न पर नहीं।


लीनियर इक्वेशन का परिणाम ये है-

चूंकि ICICI इंडिपेंडेंट है और HDFC डिपेंडेंट है, इसलिए यहां समीकरण ये होगा 

HDFC = Price of ICICI * 7.613 – 663.677

मुझे उम्मीद है कि आप इस समीकरण से परिचित हैं। जो इस समीकरण के बारे में नहीं जानते हैं उनको मेरी सलाह होगी कि वह पिछले दो अध्यायों को पढ़ें। वैसे संक्षेप में कहें तो यह समीकरण ICICI  की कीमत के आधार पर HDFC की कीमत का अनुमान लगाने की कोशिश करता है। 

दूसरे शब्दों में कहें तो, हम ICICI  के संदर्भ में HDFC की कीमत को बताने की कोशिश कर रहे हैं। 

अब हम यहां इसको उलट देते हैं। अब ICICI  डिपेंडेंट है और HDFC इंडिपेंडेंट है। 

अब जो नतीजे निकलते हैं वो ये हैं –

और अब समीकरण है 

ICICI = HDFC * 0.09 + 142.4677

तो आप किन्हीं दो स्टॉक का रिग्रेसन आप दो तरीके से कर सकते हैं पहले एक स्टॉक को डिपेंडेंट और दूसरे को इंडिपेंडेंट बनाया और बाद में, इसको उलट कर भी आप रिग्रेसन निकाल सकते हैं। 

लेकिन सवाल यह है कि यह आप कैसे तय करें कि कौन सा स्टॉक डिपेंडेंट है और कौन सा इंडिपेंडेंट है। या इन दोनों में से किसको पहले रखना चाहिए और किसको बाद में 

इस सवाल का जवाब तीन चीजों पर निर्भर करता है –

  1. स्टैंडर्ड एरर (Standard Error)
  2. इंटरसेप्ट का स्टैंडर्ड एरर (Standard Error of Intercept) 
  3. इन दो वेरिएबल का रेश्यो 

याद रखिए कि ऊपर का लीनियर इक्वेशन यह बताता है कि ICICI  की कीमत में HDFC के मुकाबले क्या बदलाव हो रहा है (ऊपर के समीकरण को देखें)। एक स्टॉक की कीमत में बदलाव को दूसरे स्टॉक के आधार पर बताना कभी भी 100 % सही नहीं हो सकता। ऐसा होता तो कोई दिक्कत ही नहीं होती।

लेकिन इसके बावजूद ये समीकरण ऐसा होना चाहिए कि ये एक स्टॉक (डिपेंडेंट वेरिएबल) की कीमत में होने वाले बदलाव को दूसरे स्टॉक (इंडिपेंडेंट वेरिएबल) के हिसाब से बता सके। ये जितना अच्छा बता सकेगा उतना ही अच्छा।

अब यहां पर दूसरा सवाल आता है – हम ये कैसे पता करें कि लीनियर रिग्रेसन का समीकरण कितना अच्छा है, इसके लिए ये रेश्यो काम आता है – 

Standard Error of Intercept (इंटरसेप्ट का स्टैंडर्ड एरर) / Standard Error (स्टैंडर्ड एरर

इस रेश्यो को समझने के लिए इसमें इस्तेमाल किए गए अंश (Numerator) और हर (Denominator) को समझना होगा।

10.2 – फिर से रेजिडुअल्स पर –  Back to Residuals

ICICI को इंडिपेंडेंट और HDFC को डिपेंडेंट रख कर निकाला गया लीनियर रिग्रेसन का समीकरण ये है –

HDFC = Price of ICICI * 7.613 – 663.677

इसका मतलब ये है कि अगर हमें ICICI की कीमत पता है तो हम HDFC की कीमत का अनुमान लगा सकते हैं। लेकिन इस अनुमानित कीमत और वास्तविक कीमत में अंतर होगा? इस अंतर को ही रेजिडुअल्स कहते हैं।

जब आप ICICI को इंडिपेंडेंट रखते हुए HDFC की कीमत का अनुमान लगाते हैं तो ये रेजिडुअल्स मिलते है – 

मैं जब भी रिग्रेशन के इक्वेशन और रेजिडुअल्स की बात करता हूं तो मुझसे सवाल पूछा जाता है – रिग्रेशन का फायदा क्या है अगर हर बार रेजिडुअल्स मिलना है या फिर ऐसे समीकरण पर भरोसा करने की क्या जरूरत है जो कि एक बार भी ठीक तरीके से अनुमान नहीं लगा पाता? 

ये सवाल ठीक है। अगर आप ऊपर दिखाए गए रेजिडुअल्स को ध्यान से देखेंगे तो आपको दिखेगा कि ये नीचे -288 से ऊपर 548 तक जाता है। इसलिए भी इसके आधार पर कीमत का अनुमान लगाना बहुत काम का नहीं है। 

लेकिन ये सब कुछ किसी एक इंडिपेंडेंट स्टॉक के आधार पर एक डिपेंडेंट स्टॉक की कीमत का अनुमान लगाने के लिए नहीं किया जा रहा, इसके मूल में तो रेजिडुअल्स है। 

मैं आपको समझाता हूं, रेजिडुअल्स एक खास तरीके से बर्ताव करते हैं। अगर हम इसको समझ लें और इसके पीछे का पैटर्न समझ लें, तो हमारे लिए ट्रेड करना आसान हो जाएगा। एक ऐसा ट्रेड जिसमें हम एक स्टॉक खरीद रहे होंगे और एक बेच रहे होंगे यानी यह एक पेयर ट्रेड होगा। 

अगले कुछ अध्यायों में हम इस पर विस्तार से चर्चा करेंगे। लेकिन अभी हम स्टैंडर्ड एरर पर बात करते हैं जो कि हमारे Standard Error of Intercept (इंटरसेप्ट का स्टैंडर्ड एरर) / Standard Error (स्टैंडर्ड एरर) समीकरण में नीचे या डिनॉमिनेटर की जगह पर है।

जब भी आप लीनियर रिग्रेशन ऑपरेशन करते हैं तो हर बार एक स्टैंडर्ड एरर बताया जाता है। इसे नीचे के चित्र में देखिए –

स्टैंडर्ड एरर वास्तव में रेजिडुअल्स का स्टैंडर्ड डेविएशन होता है। याद रखिए कि रेजिडुअल्स खुद भी एक टाइम सीरीज अरे (Time Series Array) हैं इसलिए अगर आप रेजिडुअल्स का स्टैंडर्ड डेविएशन निकालेंगे तो आपको एक स्टैंडर्ड एरर मिलेगा। 

आइए जरा इस रेजिडुअल्स का स्टैंडर्ड एरर निकालते हैं। मैं इसके लिए X = ICICI और  Y= HDFC ले रहा हूं

एक्सेल से मुझे पता चल रहा है कि स्टैंडर्ड डेविएशन 152.665 है। हमारे समरी आउटपुट (Summary Output) में स्टैंडर्ड एरर निकला था 152.89 । इस मामूली अंतर का बहुत महत्व नहीं है। यानी दोनों एक ही हैं।

इंटरसेप्ट का स्टैंडर्ड एरर (Standard Error of Intercept ) थोड़ा ज्यादा मुश्किल है, ये हर बार रिग्रेसन रिपोर्ट में बताया जाता है। X = ICICI और  Y= HDFC के लिए इंटरसेप्ट का स्टैंडर्ड एरर ये है – 

याद कीजिए कि रिग्रेसन इक्वेशन या समीकरण है – 

y=M*x+ C

जहां,

M = स्लोप 

C = इंटरसेप्ट

आपको शायद समझ में आ गया होगा कि M और C दोनों ही एक अनुमान हैं। इन का अनुमान वास्तव में रिग्रेसन एल्गोरिदम (Regression Algorithm)  को दिए गए हिस्टोरिकल डेटा के आधार पर लगाया जाता है। इस डेटा में कुछ न कुछ ऐसी बातें (noise) जरूर होंगी जो उसे सही परिणाम देने से रोकती होंगी और यही वजह है कि इस अनुमान के गलत जाने की संभावना रहती है। 

इंटरसेप्ट के अनुमान में होने वाले वैरियंस को इंटरसेप्ट का स्टैंडर्ड एरर (Standard Error) कहा जाता है। यह हमें बताता है कि इंटरसेप्ट वास्तव में खुद कितना इधरउधर जा सकता है यानी उसमें कितना वैरियंस आ सकता है। तो यह खुद इस तरीके का स्टैंडर्ड एरर होता है। संक्षेप में देखें तो 

  • इंटरसेप्ट का स्टैंडर्ड एरर – इंटरसेप्ट के अनुमान में होने वाला वैरियंस 
  • स्टैंडर्ड एरर – रेजिडुअल्स का वैरियंस

अब क्योंकि हमने इन दोनों वेरिएबल को परिभाषित कर लिया है तो अब वापस लौटते हैं एरर रेश्यो (Error Ratio) पर । याद रखिए कि एरर रेश्यो (Error Ratio)  एक आम शब्द नहीं है, इसे मैंने निकाला है, जिससे इस बात को ठीक से समझ सकें। 

तो यहां एरर रेश्यो होगा –

एरर रेश्यो (Error Ratio) इंटरसेप्ट का स्टैंडर्ड एरर (Standard Error of Intercept) / स्टैंडर्ड एरर  (Standard Error)

इसे मैंने कैलकुलेट कर लिया है – 

  1. X की जगह ICICI और Y की जगह HDFC रखने पर  =  0.401 
  2. X की जगह HDFC और Y की जगह ICICI रखने पर  =  0.227 

हम किस स्टॉक को X की जगह रखेंगे और किस स्टॉक को Y की जगह रखेंगे यह इस बात पर निर्भर करेगा कि एरर रेश्यो की वैल्यू क्या है। यह जितना कम होगा उतना बेहतर। क्योंकि HDFC को X  के तौर पर ICICI को Y के तौर पर रखने पर रेश्यो सबसे कम मिल रहा है इसलिए हम HDFC को इंडिपेंडेंट वेरिएबल (X) और ICICI को डिपेंडेंट वेरिएबल (Y) रखेंगे। 

वैसे तो मैं आपको यह बताना चाहता हूं कि हम एरर रेश्यो का इस्तेमाल X और Y के फैसले के लिए क्यों कर रहे हैं, लेकिन मैं इसको अभी नहीं बताऊंगा। मैं इसको तब बताऊंगा जब हम पेयर ट्रेड का उदाहरण देख रहे होंगे। 

अभी बस यह याद रखिए कि एरर रेश्यो को कैलकुलेट करना है और उसके आधार पर हमें यह तय करना है कि कौन सा स्टॉक डिपेंडेंट है और कौन सा स्टॉक इंडिपेंडेंट होगा। 

इस अध्याय में इस्तेमाल किए गए एक्सेल शीट को आप यहां से डाउनलोड कर सकते हैं। here.

इस अध्याय की मुख्य बातें

  1. X इंडिपेंडेंट स्टॉक होता है और Y डिपेंडेंट स्टॉक होता है। 
  2. किस स्टॉक को X जगह पर रखा जाए और कौन सा स्टॉक Y होगा, इसका फैसला एरर रेश्यो के आधार पर किया जाता है।
  3. किसी लीनियर रिग्रेशन इक्वेशन में स्लोप और इंटरसेप्ट दोनों ही एक तरीके के अनुमान होते हैं। 
  4. एरर रेश्यो (Error Ratio) =  इंटरसेप्ट का स्टैंडर्ड एरर (Standard Error of Intercept) / स्टैंडर्ड एरर (Standard Error)
  5. रेजिडुअल्स के स्टैंडर्ड डेविएशन को स्टैंडर्ड एरर कहते हैं।
  6. इंटरसेप्ट का स्टैंडर्ड एरर आपको यह बताता है कि इंटरसेप्ट में कितना वैरियंस है।
  7. आप स्टॉक 1 को स्टॉक 2 से या स्टॉक 2 को स्टॉक 1 से रिग्रेस कर सकते हैं, बस देखना ये है कि किसका एरर रेश्यो कम है और उसके आधार पर डिपेंडेट और इंडिपेंडेंट स्टॉक का फैसला कर लें।
  8. रेजिडुअल्स एक खास तरीके से बर्ताव करते हैं। अगर आप उनको समझ जाए तो आपके लिए पेयर ट्रेडिंग के लिए पेयर का अनुमान लगाना आसान होगा।

 




1 comment

View all comments →
  1. Manish says:

    Sir, you are a genius. 🙏🙏🙏🙏🙏🙏

View all comments →
Post a comment