Sujet :
SAS STAT
-
Calcul des proba par individu � partir d'un modele obtenu par regression logistique
Bonjour � tous,
j'ai cherch� sur les autres sujets du forum mais je n'ai pas trouv� clairement ma r�ponse...
j'ai construit 1 mod�le pour 1 score d'app�tence via 1 r�gression logistique. J'obtiens donc 1 mod�le (pas tr�s bon mais je n'ai pas le choix), avec coeff, odd-ratio etc,... qui pr�dit ma variable � expliquer binaire en fonction de variables qualitatives uniquement.
Mon code :
ods graphics on;
proc logistic data=lib.ech_app outest=outest;
class Region2 (ref="Ile-de-France")
categorie_vendeurs2 (ref="Bon en 2016")
financement_choisi (ref="Financement A")
Mod_le_du_v_hicule2 (ref="208")
Tranche_Age_Vehicule2 (ref="Neuf")
Tranche_Age_Conducteur2 (ref="26 � 35 ans")
profession2 (ref="Retrait�")
/ param=ref ;
model cible(event='1') = Region2
categorie_vendeurs2
financement_choisi
Mod_le_du_v_hicule2
Tranche_Age_Vehicule2
Tranche_Age_Conducteur2
profession2
/ selection=stepwise rsquare lackfit ctable outroc=lib.table_roc sle=0.1 sls=0.1; *sle crit�re
significativ� d'entr�e pour variable, sls pareil pour enlever;
output out=prediction pred=score predprobs=I ;
run;
J'obtiens donc dans la table outest la variable score (cad une proba entre 0 et 1 qui indique si l'individu est susceptible d'adh�rer au produit d'apr�s le mod�le construit, on est bien d'accord?), et cela pour chaque individu, du style:
Individu Region vendeur financement modele_vehicule age vehic age conducteur profession score
Albert ouest bon A autre 4 � 8 ans 26 � 35 autre 0,690257869
OK cool !
Mais moi quand je recalcule le score � la main je n'obtiens pas la m�me chose que SAS...
On a score s=exp(Prevision)/(1+exp(Prevision))
avec
prev= 0.235354573 +
+recod_region_centre*(-0.180050314)
+recod_region_est*(-0.15255249)
+recod_region_nord*(-0.012792332)
+recod_region_ouest*(-0.124823431)
+recod_region_sud_est*(-0.199070468)
+recod_region_sud_ouest*(-0.090388005)
+recod_region_ile*1
+recod_vendeurs_bon*1
+recod_vendeurs_faible*(-0.249896708)
+recod_vendeurs_non_classe*(-0.108215194)
+recod_financement_credipar*(-0.858278869)
+recod_financement_non_credipar*1
+recod_Modele_208*1
+recod_Modele_2008*(-0.263126222)
+recod_Modele_308*(-0.295083787)
+recod_Modele_3008*(-0.176075831)
+recod_Modele_108*(0.162555191)
+recod_Modele_207*(-0.020595787)
+recod_Modele_5008*(-0.183801131)
+recod_Modele_partner*(0.481436233)
+recod_Modele_508*(-0.550313811)
+recod_Modele_206*(0.098061553)
+recod_Modele_autre*(-0.046590492)
+recod_age_vehic_neuf*1
+recod_age_vehic_1a*(0.111919614)
+recod_age_vehic_2a*(0.251171015)
+recod_age_vehic_4a*(0.485113634)
+recod_age_vehic_8a*(0.968681093)
+recod_age_conduc_moins25*(-0.69031397)
+recod_age_conduc_26a*1
+recod_age_conduc_36a*(0.381845762)
+recod_age_conduc_46a*(0.236820454)
+recod_age_conduc_56a*(0.131546542)
+recod_age_conduc_66a*(0.148383349)
+recod_age_conduc_85a*(-0.051607511)
+recod_profession_retraite*1
+recod_profession_autre*(0.148294092)
Les coefficients au dessus sont les coefficients pr�sents dans la table outest de la regression logistique, associ�es pour chaque modalit� de variables.
Probl�me : je mets quoi comme coefficient pour les modalit�s de r�f�rence ??? ici j'ai mis 1, mais ce ne serait pas plut�t 0 ?? je ne sais pas car quand j'essaie de recalculer le score avec les 2 m�thodes je n'obtiens pas les m�mes valeurs que SAS...
Je vous remercie de votre aide !!
-
- Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les r�seaux sociaux.
- Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.
-
-
-
Ce que je voulais dire c'est que m�me si mes proba calcul�s �taient fausses � cause d'un d�calage constant (plus grand que le score sorti par sas), alors la pr�vision calcul� par moi auraient quelques points de proba en plus.
Merci en tout cas !
+ R�pondre � la discussion
Cette discussion est r�solue.