Die sleutelverskil tussen klassifikasie en regressieboom is dat in klassifikasie die afhanklike veranderlikes kategories en ongeordend is, terwyl die afhanklike veranderlikes in regressie kontinue of geordende hele waardes is.
Klassifikasie en regressie is leertegnieke om modelle van voorspelling te skep uit versamelde data. Beide tegnieke word grafies voorgestel as klassifikasie- en regressiebome, of eerder vloeidiagramme met verdelings van data na elke stap, of eerder, “vertakking” in die boom. Hierdie proses word rekursiewe partisie genoem. Velde soos Mynbou gebruik hierdie klassifikasie- en regressie-leertegnieke. Hierdie artikel fokus op die klassifikasieboom en regressieboom.
Wat is klassifikasie?
Klassifikasie is 'n tegniek wat gebruik word om by 'n skema uit te kom wat die organisasie van data toon wat met 'n voorloperveranderlike begin. Die afhanklike veranderlikes is wat die data klassifiseer.
Figuur 01: Data-ontginning
Die klassifikasieboom begin met die onafhanklike veranderlike, wat in twee groepe vertak, soos bepaal deur die bestaande afhanklike veranderlikes. Dit is bedoel om die response toe te lig in die vorm van kategorisering wat deur die afhanklike veranderlikes veroorsaak word.
Wat is regressie
Regressie is 'n voorspellingsmetode wat gebaseer is op 'n veronderstelde of bekende numeriese uitsetwaarde. Hierdie uitsetwaarde is die resultaat van 'n reeks rekursiewe verdelings, met elke stap met een numeriese waarde en 'n ander groep afhanklike veranderlikes wat na 'n ander paar soos hierdie vertak.
Die regressieboom begin met een of meer voorloperveranderlikes en eindig met een finale uitsetveranderlike. Die afhanklike veranderlikes is óf kontinue óf diskrete numeriese veranderlikes.
Wat is die verskil tussen klassifikasie en regressie?
Klassifikasie teen regressie |
|
'n Boommodel waar die teikenveranderlike 'n diskrete stel waardes kan neem. | 'n Boommodel waar die teikenveranderlike kontinue waardes tipies reële getalle kan neem. |
Afhanklike veranderlike | |
Vir klassifikasieboom is die afhanklike veranderlikes kategories. | Vir regressieboom is die afhanklike veranderlikes numeries. |
Waardes | |
Het 'n vasgestelde hoeveelheid ongeordende waardes. | Het óf diskrete dog geordende waardes óf indiskrete waardes. |
Doel van konstruksie | |
Die doel van die konstruksie van die regressieboom is om 'n regressiestelsel by elke determinanttak te pas op 'n manier dat die verwagte uitsetwaarde opduik. | 'n Klassifikasieboom vertak soos bepaal deur 'n afhanklike veranderlike afgelei van die vorige nodus. |
Opsomming – Klassifikasie vs Regressie
Regressie- en klassifikasiebome is nuttige tegnieke om die proses wat dui op 'n bestudeerde uitkoms uit te stippel, hetsy in klassifikasie of 'n enkele numeriese waarde. Die verskil tussen die klassifikasieboom en die regressieboom is hul afhanklike veranderlike. Klassifikasiebome het afhanklike veranderlikes wat kategories en ongeordend is. Regressiebome het afhanklike veranderlikes wat kontinue waardes of geordende hele waardes is.