Մեքենայի ուսուցում – Դասընթաց/փորձարկում

Մեքենայի ուսուցում – Դասընթաց/փորձարկում

Գնահատեք ձեր մոդելը

Machine Learning-ում մենք մոդելներ ենք ստեղծում՝ կանխատեսելու որոշակի իրադարձությունների արդյունքը, ինչպես նախորդ գլխում, որտեղ մենք կանխատեսում էինք ավտոմեքենայի CO2 արտանետումը, երբ գիտեինք քաշը և շարժիչի չափը:

Չափելու համար, թե արդյոք մոդելը բավականաչափ լավն է, մենք կարող ենք օգտագործել մեթոդ, որը կոչվում է Train/Test:


Ինչ է Գնացք/Թեստ

Train/Test-ը ձեր մոդելի ճշգրտությունը չափելու մեթոդ է:

Այն կոչվում է Train/Test, քանի որ դուք բաժանում եք տվյալների հավաքածուն երկու խմբի՝ ուսուցման և թեստավորման հավաքածուի:

80% վերապատրաստման համար, իսկ 20% թեստավորման համար:

դուք գնացք մոդելը, օգտագործելով ուսումնական հավաքածու:

դուք փորձարկում մոդելը, օգտագործելով թեստավորման հավաքածու:

Գնացք մոդելը նշանակում է ստեղծել մոդելը:

փորձարկում մոդելը նշանակում է ստուգել մոդելի ճշգրտությունը:


Սկսեք տվյալների հավաքածուից

Սկսեք տվյալների հավաքածուից, որը ցանկանում եք փորձարկել:

Մեր տվյալների հավաքածուն ցույց է տալիս խանութում 100 հաճախորդներ և նրանց գնումների սովորությունները:

Օրինակ

Արդյունքը:

X առանցքը ներկայացնում է գնում կատարելուց առաջ րոպեների քանակը:

y առանցքը ներկայացնում է գնման վրա ծախսված գումարի չափը:

Գործարկման օրինակ »


Split into Train/Test

The ուսուցում հավաքածուն պետք է լինի նախնական տվյալների 80%-ի պատահական ընտրություն:

The փորձարկում հավաքածուն պետք է լինի մնացած 20%-ը:

train_x = x[:80]
train_y = y[:80]

թեստ_x = x[80:]
test_y = y[80:]


Ցուցադրել վերապատրաստման հավաքածուն

Ցուցադրել նույն ցրման սյուժեն ուսումնական հավաքածուի հետ.

Օրինակ

Արդյունքը:

Կարծես սկզբնական տվյալների հավաքածուն է, ուստի թվում է, որ այն արդար ընտրություն է.

Գործարկման օրինակ »


Ցուցադրել թեստավորման հավաքածուն

Համոզվելու համար, որ թեստավորման հավաքածուն ամբողջովին տարբեր չէ, մենք կնայենք նաև թեստավորման հավաքածուին:

Օրինակ

Արդյունքը:

Փորձարկման հավաքածուն նույնպես նման է սկզբնական տվյալների հավաքածուին.

Գործարկման օրինակ »


Տեղադրեք տվյալների հավաքածուն

Ի՞նչ տեսք ունի տվյալների հավաքածուն: Իմ կարծիքով, ես կարծում եմ, որ լավագույնը կլինի ա բազմանդամ ռեգրեսիա, ուստի եկեք գծենք բազմանդամ ռեգրեսիայի գիծ:

Տվյալների կետերի միջով գիծ քաշելու համար մենք օգտագործում ենք plot() matplotlib մոդուլի մեթոդը.

Օրինակ

Տվյալների կետերի միջով գծեք բազմանդամ ռեգրեսիոն գիծ.

Արդյունքը:

Գործարկման օրինակ »

Արդյունքը կարող է հաստատել իմ առաջարկությունը տվյալների հավաքածուի վերաբերյալ, որը համապատասխանում է բազմանդամ ռեգրեսիային, թեև դա մեզ որոշ տարօրինակ արդյունքներ կտա, եթե մենք փորձենք կանխատեսել արժեքներ տվյալների հավաքածուից դուրս: Օրինակ. տողը ցույց է տալիս, որ հաճախորդը խանութում 6 րոպե անցկացնում է 200 արժողությամբ գնումներ:

Բայց ինչ վերաբերում է R-քառակուսի միավորին: R-քառակուսի միավորը լավ ցուցիչ է, թե որքանով է իմ տվյալների հավաքածուն համապատասխանում մոդելին:


R2

Հիշո՞ւմ եք R2-ը, որը նաև հայտնի է որպես R-squared:

Այն չափում է x առանցքի և y առանցքի միջև կապը, և արժեքը տատանվում է 0-ից 1-ի միջև, որտեղ 0-ը նշանակում է ոչ մի կապ, իսկ 1-ը նշանակում է ամբողջովին կապված:

Sklearn մոդուլն ունի մեթոդ, որը կոչվում է r2_score() դա կօգնի մեզ գտնել այս հարաբերությունները:

Այս դեպքում մենք կցանկանայինք չափել կապը հաճախորդի խանութում գտնվելու րոպեների և նրա ծախսած գումարի միջև:

Օրինակ

Որքանո՞վ են իմ վերապատրաստման տվյալները տեղավորվում բազմանդամ ռեգրեսիայի մեջ:

Փորձեք ինքներդ »

Նշում: 0.799 արդյունքը ցույց է տալիս, որ կա լավ հարաբերություն:

Ներդրեք թեստավորման հավաքածուն

Այժմ մենք պատրաստել ենք մի մոդել, որը լավ է, համենայն դեպս, երբ խոսքը վերաբերում է մարզումների տվյալներին:

Այժմ մենք ցանկանում ենք փորձարկել մոդելը նաև փորձարկման տվյալների հետ, որպեսզի տեսնենք, թե արդյոք մեզ նույն արդյունքը կտա:

Օրինակ

Եկեք գտնենք R2 միավորը թեստավորման տվյալները օգտագործելիս.

Փորձեք ինքներդ »

Նշում: Արդյունքը 0.809 ցույց է տալիս, որ մոդելը նույնպես համապատասխանում է փորձարկման հավաքածուին, և մենք վստահ ենք, որ կարող ենք օգտագործել մոդելը ապագա արժեքները կանխատեսելու համար:


Կանխատեսել արժեքներ

Այժմ, երբ մենք հաստատել ենք, որ մեր մոդելը լավ է, մենք կարող ենք սկսել կանխատեսել նոր արժեքներ:

Օրինակ

Որքա՞ն գումար կծախսի գնորդը, եթե նա մնա խանութում 5 րոպե:

Գործարկման օրինակ »

Օրինակը կանխատեսում էր, որ հաճախորդը կծախսի 22.88 դոլար, ինչը, կարծես, համապատասխանում է գծապատկերին.


ArmenianEnglish