Mirov dibihîze ku pirrî caran, kesên zane dibêjin ku #matematîk# « zimanê xwezayê » ye. Lê ev ziman zimanekî çawa ye ? Belê, gava ku mirov hez bike hindek diyardeyên civakî, siyasî, fezayî, aborî û hwd. baştir fêm bike û wana bi zimanê matematîkê « bixwîne », divê mirov modelîzasyonên matematîkê bi kar bîne. Ango, zimanê matematîkê, formul û modelîzasyon e. Em bêjin ji bo pêderxistina cihê stêrkekî, belavbûna germahiyê yan jî rîska veberhênaneke fînansî ; ev formulên matematîkê karê mirovan gelek hêsan dikin. Bikaranîna zanista matematîkê ya bi vî rengî, jiyana mirovan ya rojane jî rehettir dike û îro bi xêra “daneyên girseyî” (big data) mirov bandora van formulan ya li ser jiyana rojane dikare bibîne. Ez ê bi vê nivîsê hewl bidim zelal bikim bê ev daneyên girseyî çawa bi xêra formulên matematîkê ve tên şixulandin û çawa mirov bi vî rengî dikarin siberojê bibînin ango bibin xwedî pêşbîniyê.
Mirovan hertim qeyda agahî û daneyan(data) çêdikirin. Pêşî li Mezopotamya û Misrê, mirov li ser heriya şil dinivîsand, paşê ew herî dipijandin. Paşê li ser çermê heywanan nivîs û qeyd hatin çêkirin; herî dawî bi saya serê çîniyan kaxez hate kifşkirin. Tiştên ku dihat bikaranîn bi demê re guherî, lê qeydkirina dane û zanyariyan her berdewam bû. Vêca, bi şoreşa endustriyalîzmê ve êdî qeyda tiştan ji berê pirtir dihate kirin; piştî salên 1930î jî, êdî qeyda li ser wan kaxêzan bi kêr nedihat, ew kaxezên ku çînî 1800 sal berê îcad kiribûn. Xelkê dane û zanyariyan li ser kaxezê dinivîsandin û ew zanyarî dibûn pirtûkên qirase; paşê ew pirtûk diçûn nav pirtûkxaneyan, û ew kitêbên dane û agahiyan gelek cih digirtin. Jixwe xebateke lêkolînê yan jî tehlîlê ya li ser van daneyan jî karekî zehmet bû. Ji ber ku, wê gavê, diviyabû ku lêkolînerek here hebo hebo wan daneyên di kitêbên qeydan de bixwîne. Ev derdekî mezin bû ji bo lêkolîneran û jê re dermanekî diviyabû. Lê çareserî bi kaxizê nedibû, diviyabû çareyeke elektronîk bête dîtin û lêkolîneran ketin pey vê yekê; axirê çareyeke elektronîk hate dîtin, êdî hewcetî bi pirtûkên qirase û depoyên qeydan nema, lê bikaranîna wan dane û qeydan dîsa mina berê zehmet bû. Dîsa mîna berê ji bo ku lêkolînerek ji wan qeydan xêrekî bibîne, bi saya wan qeydan texmîneke ji bo siberojê bike; diviyabû emrê xwe bi lêkolîn û xwendinê pûç bike. Înternet hat û her ku diçû, hejmara daneyan jî zêdetir dibû, di sala 1993yan de bi îcada World Wide Web’ê ve mîna ku teqînek çêbe hejmara dane û agahiyan jî firriya. Ber destê însanan gelek dane û agahî hebûn ; lê mirovan dê çi bikirana ji van dane û agahiyan ? Belê heta salên 2000î, ev dane û qeyd ji bo pêşbîniyan nehatibûn bikaranîn ; jixwe nikaribûn ew bi kar bînin çûnkî ji bo ku mirov pêşbîniyan bike divê di destê microvan de heta hurgiliya serê derziyê, qeyda dane û agahiyan hebe. Di salên 2000î de, zanistvan û şîrket fêm dikin ku ew dikarin êdî pêşbîniyan bikin ; lê nizanibûn bi çi rengî bikin. Axirê formulên matematîkê hatin hewara wan.
Gava ku di destê mirov de daneyên mezin (big data) hebin, mirov bikaribe wan daneyan bi ewayekî elektronîk qeyd bike û bikaribe wan transfer bike ; formulên matematîkê dikarin bibin çare ji bo bikaranîna wan daneyan. Di salên 2000î de rewş wiha bû, û lêgerîna metodên matematîkê dest pê kiribû. Hedefa zanist û şîrketan kifş bû, wan dixwestin daneyên ber destê xwe yên bo mînak 10 salên borî bi kar bînin û bi xêra wan daneyên siberojê texmîn bikin. Hez dikim niha bala xwe bidimê ka ew metod, formul û ekwasyon (hevsengiya matematîkî) çawa tên avakirin û bikaranîn.
Ji bo ku mirov bi dane û qeydan pêşbîniya siberojê bike, mirov dikare gelek metodên matematîkê bişixûlîne ; lê ez ê tenê behsa 2 metodên bingehîn bikim : Regresyona Lîneer û Regresyona Lojîstîk. Em ê bi mînakên hêsan van metodan rave bikin.
Regresyona Lîneer cara pêşî ji aliyê Francis Galton ve hatiye çêkirin. Formula Galton ev e :
Y=aX1+bX2+cX3+dX4……+Ɛ
Niha em ê vê formulê rave bikin. « Y » ew tişt e ku tê texmînkirin, « X1 » varyabla yekem e, herfa « a »yê jî nirxa tesîr û qewweta X1 ê ye. Varyabl bi vî rengî heta hetayê diherrin, mînak « X2 » varyabla duyem e, herfa « b »yê jî te’sîra varyabla X2yê ye. Xalên ku em piştî « X4 »ê dibînin, ev xalên han (………) nîşaneya varyablên wekî eX5, fX6ê ne ku me li ser formulê nenivîsiye lê me wekî xal ew nîşan dane. Îşareta li dawiyê « Ɛ » jî nîşaneya şaşî û xeletiyê ye. Bo mînak, em hez dikin bizanin bê mehek bi şûn de li Parîsê qelîteya hewayê dê çawa bibe. Em bêjin em endekseke ji 1 ê heta 100 an çêdikin. Li ber destê me qeyd û daneyên 10 salên borî hene, em dizanin bê di deh salên borî de hewaya Parîsê kengî paqij bûye û kengî qirêj bûye herwiha em di derheqê bajarê Parîsê de xwedî daneyên deqîq in, em dizanin çend erebe hene li nav Parîsê, çend kes lê dijî, çend fabrîqe hene û hwd. Em ê 100 varyablan têxin nav vê ekwasyona matematîkî. Bila varyabla ewil bibe « hejmara erebeyên li Parîsê » (em dizanin ku çiqas erebe hebe, hewa ewqas qirêj dibe), bila varyabla me ya 2 yan bibe « hejmara fabrîqeyên li Parîsê », varyabla 3 yan bila bibe « erdê bi dar û ber yê li Parîsê » û bila varyabla 4 an jî bibe « hejmara Kurdên Parîsê ku dizanin govendê bigrin ». Me got « Y » qelîteya hewayê li Parîsê ye ; X1 hejmara erebeya ye, X2 ya febrîqeyan, X3 ya erdên şîn yên li Parîsê ye, X4 jî hejmara Kurdên govendhez e. Gava ku em ekwasyona xwe çêdikin, em ê nirxên wekî « a », « b », « c »yê daynin pêşiya her varyablê ; heke varyabla me te’sîreke mezin li ser paqijiya hewayê bike, em ê nirxa wê varyablê bilind bikin ; bo mînak em ê nirxa varyabla yekem, duyem û sêyem bilind bikin ; çûnkî te’sîra hejmara erebe û febrîqeyan herwiha te’sîra firehiya erdê şîn li ser paqijiya hewayê heye, lê em ê nirxa varyabla 4 an gelek nizm bikin çimkî te’sîra kesên ku govendê digrin li ser paqijiya hewayê nîne. Loma di ekwasyona me de, nirxa X4ê yanî herfa « d »yê wê bibe sifir, lê nirxên varyablên din « a », « b » û « c » li gorî daneyên ber destê me dê bilind bibin. Di dawiya ekyasyona me de, em ê nirxa şaşî û xeletiyê « Ɛ » daynin. Ev nirxa şaşî û xeletiyê jî li gorî qanûna îxtîmalê ya Gausse’ê tê diyarkirin. Piştî ku me ev gişt kirin nav ekwasyona xwe, em ê bersiva « Y »yê bibînin ; yanî em ê bizanibin bê mehek şûn de hewayê Parîsê hewayekî çawa bibe. Vêca em berê xwe bidine Regresyona Lojîstîk.
Regressiona lojîstîk bi xêra Joseph Berkson, doxtor û statîstîkçiyê mezin; di sala 1944 de hatiye çêkirin. Ev formul ji bo nirxên wesf û qelîteyê tê bikaranîn, mantixa Regresyona Lojîstîk ji ya Regresyona Lîneer ne dûr e. Ferqa wan ev e : Mirov bi Regressiona Lîneer nirxeke di navbera 1 û 100 datîne; lê ji bo Regressiona Lojîstîk mirov nirxeke di navbera 0 û 1 ê datîne. Ev 0 û 1 tên çi wateyê ? Heke encama Regresyona Lojîstîk 0 be, ev tê wateya “Na”yê; heke encam “1” be, ev tê wateya “Erê”yê. Yanî ev formul wilo dike ku em li ser daxwazek yan meseleyekê biryarê bidin, ango em bêjin “Erê” yan “Na”. Minakeke hesan ji modelîzasyona Regresyona Lojîstîk :
π(x) = P(Y = 1|X = x) (îxtîmala ku Y bibe “1” dema ku em nirxê “X” ê nas dikin)
π(x) = exp(aX1+bX2+….+) /1 + exp(aX1+bX2+….+)
Lê ji bo ku em vê Regresyona Lojîstîk bi xweşikî bi kar bînin; dibe ku hewcetiya me bi Regresyona Lîneer hebe. Ev formul di temamê panqeyan de tê bikaranîn, tewer panqeyên mezin weke HSBC, Bank of China û Bank of America van formulan bi kar tînin. Em bêjin yekî/ê tê û ji panqeyê hez dike pere deyn bike. Panqecî derheqê wî kesî de hemû agahiyên kêrhatî distîne, emrê wî, rewşa wî ya aborî, welat û bajarê wî, hejmara zarokên wî û hwd. Panqecî van agahiyan datîne ser komputerê û komputer bi saya sepanên regresyonan lê mêze dike, bi endekseke ji 0ê em bêjin heta 100î ekwasyonekê çê dike û dibêje bê îxtîmala ku ev kes deynê xwe bikaribe bide ji sedî çend e. Piştî ku ev encam ji Regresyona Lîneer derket, panqecî vê encamê dixe nav sepana komputerê ku Regresyona Lojîstîk bi kar tine. Herî dawî Regresyona Lojîstîk yan dibêje “0” yan dibêje “1”. Panqecî mîna me Kurdan ji wî kesî napirse bê ka ew merivê kî ye, bawerî pê dibe yan na. Panqecî bi xebera Regresyona Lojîstîk dike, heke encam “0” be, ji kesê deynxwaz re dibêje “Na”, heke encam “1” be jê re dibêje “Erê”.
Bi salan in ku ev metod û formulên han li ser pirtûkên matematîkê hene ; lê heta îro ew zêde bi kêr nedihatin çimkî dane û qeydên mezin (big data) teze van salên dawî gihiştin asteke têr ku mirov bikaribe jê sûdê werbigre herwiha bi stokaja elektronîk ev yek pêkan bû ku formulên matematîkê yên «razber û fikirî» îro encamên «îcraî û şênber» bidin. Îro ji her demî zêdetir dane û agahî dikevin destê me ; loma ev formulên matematîkê her diçe girîngtir dibe. Bi xêra mezinbûna daneyan, êdî mirov dê bikaribe rêjeya xeletî û şaşîtiyê jî daxîne ; yanî çiqas zanyariyên îstatîstîkî zêde bibin, ewqas nirxa « Ɛ »ê ango xeletiyê kêm dibe û encamên pêşbîniyan deqîqtir dibin. Herwiha, gava ku daneyên me têra xwe hebin, em dikarin ji qanûnê din yên matematîkê (mînak qanûna konverjansê) sûdê werbigrin. Gava ku dane û qeyd pirtir bin û formul û metodên matematîkê yên cur bi cur bên bikaranîn, hingê mirov dikare pêşbîniyên gelek serkeftî bike.
Cihan Sorgul
Mastira Matematîk Statîstîkê
Paris 1 Panthéon
Çavkanî
1-) A very short history of Big data – Gill Press
2-) Introduction to time series and forecasting -Peter J. Brockwell, Richard A. Devis
3-)lebigdata.fr
4-)An introduction to Statistical Learning- Gareth James
5-) Ferhenga Termên Matematîkê -Dîlawer Zeraq/Mem Wenda (Weşanên Lîs)
[1]