IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

R�gression Logistique - Test d'intercations


Sujet :

SAS STAT

  1. #1
    Membre confirm�
    Homme Profil pro
    �tudiant
    Inscrit en
    Mai 2012
    Messages
    83
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activit� : �tudiant

    Informations forums :
    Inscription : Mai 2012
    Messages : 83
    Par d�faut R�gression Logistique - Test d'intercations
    Bonjour,
    je pr�sente mon probl�me :
    je souhaite r�aliser une r�gression logistique et pour ce faire j'ai r�aliser des analyse univari�es sur mes variables.
    J'ai donc s�lectionn� les variables qui sont possiblement des "facteurs d'interaction".
    Puis j'en arrive � l'analyse multivari�e, j'ai deux question pr�cises :
    J'ai r�alis� une s�lection de variables en utilisant la m�thode du backward selection (descendante).
    Pour ce faire, j'ai �limin� une � une les variables qui avaient une trop forte p_value (tout en regardant que les coefficients - beta - ne varient pas trop).
    Ma premi�re question est la suivante : Quel est le seuil � partir duquel on juge que les coefficients estim�s varient "trop" ? 0.20 ? 0.15 ? Et donc dans ce cas l�, on conserve la variable qu'on souhaitait retirer m�me si sa p_value est tr�s forte.

    Exemple, lorsque je supprime la variable statut_tabac (qui est compos� des sous-variables indicatrices tabac_1 et tabac_2) :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
     
    /*Modèle complet*/                                                                                                                                                                                             
    proc logistic data=projet.Bonami;                                                                                                                                                                              
    class Hta groupe_bis revasc diabete Class_SEVERITY_0_H4 ;                                                                                                                                                      
    model evol_binaire(ref="1") = Hta groupe_bis revasc tabac1 tabac2 diabete Class_SEVERITY_0_H4;                                                                                                                 
    test tabac1,tabac2;                                                                                                                                                                                            
    run;
    Nom : SAS.png
Affichages : 1514
Taille : 15,3 Ko

    le mod�le une fois les variables tabac_1 et tabac_2 supprim�es :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
     
    /* Modèle sans tabac*/                                                                                                                                                                                         
    proc logistic data=projet.Bonami;                                                                                                                                                                              
    class Hta groupe_bis revasc diabete Class_SEVERITY_0_H4 ;                                                                                                                                                      
    model evol_binaire(ref="1") = Hta groupe_bis revasc diabete Class_SEVERITY_0_H4;                                                                                                                               
    run;
    Nom : SAS.png
Affichages : 1183
Taille : 13,0 Ko


    Puis une fois le mod�le complet obtenu, je dois v�rifier les interactions entre mes variables restantes ? Et l�, je ne sais pas comment m'y prendre. Test de Wald ?
    Est-ce que je dois tester une � une les interactions entre chaque couple de variable ? Ou est-ce que je lance le mod�le complet avec les interactions et j'enl�ve une � une les interactions avec les plus fortes p_values ?

    Je vous joins mon code :

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
     
    proc logistic data=projet.Bonami;                                                                                                                                                                              
    class Hta groupe_bis revasc Class_SEVERITY_0_H4 ;                                                                                                                                                              
    model evol_binaire(ref="1") = Hta groupe_bis revasc tabac1 tabac2 Class_SEVERITY_0_H4                                                                                                                          
    groupe_bis*Hta groupe_bis*revasc groupe_bis*tabac1 groupe_bis*tabac2 groupe_bis*Class_SEVERITY_0_H4 ;                                                                                                          
    test tabac1,tabac2;                                                                                                                                                                                            
    run;
    Nom : SAS.png
Affichages : 1195
Taille : 23,7 Ko

    Merci pour votre aide !

  2. #2
    Membre confirm�
    Homme Profil pro
    Biostatisticien
    Inscrit en
    F�vrier 2015
    Messages
    42
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activit� : Biostatisticien
    Secteur : Associations - ONG

    Informations forums :
    Inscription : F�vrier 2015
    Messages : 42
    Par d�faut
    Bonjour Khroutchev,

    Je ne suis pas non plus un expert de la r�gression logistique mais comme tu n'as pas de r�ponse � ton probl�me, je me permets de te donner mon humble avis ^^:

    Ma premi�re question est la suivante : Quel est le seuil � partir duquel on juge que les coefficients estim�s varient "trop" ? 0.20 ? 0.15 ? Et donc dans ce cas l�, on conserve la variable qu'on souhaitait retirer m�me si sa p_value est tr�s forte.
    Je pense que la d�finition d'un seuil de variation relative est objective ! Je m'explique : Globalement on dit qu'avec 15-20% de variation relative il faut faire attention aux "facteurs modificateurs d'effets" (et donc garder la variable dans le mod�le m�me si sa p_value est forte). Mais je pense qu'en fait ce qui doit primer sur tout ces seuils "pr�d�finis", c'est ce que cela repr�sente pour toi, dans ton cas d'�tude : c'est l'effet de ta variable groupe_bis qui semble le plus varier, certes c'est environ 30% de variation ok mais cela correspond � une variation de 6% � 4% (c'est donc une variation d'un effet quasi-nul, et d'ailleurs la p_valeur de la variable groupe_bis n'est pas significative)...

    Autre chose, pour moi entre tes 2 premi�res estimations de param�tres, tu n'as pas enlev� 1 mais 2 variables (tabac_1 et tabac_2). A mon sens l�int�r�t de cr�er des variables indicatrices c�est justement de pourvoir traiter s�par�ment les diff�rentes modalit�s du statut tabagique...

    Puis une fois le mod�le complet obtenu, je dois v�rifier les interactions entre mes variables restantes ? Et l�, je ne sais pas comment m'y prendre. Test de Wald ?
    Est-ce que je dois tester une � une les interactions entre chaque couple de variable ? Ou est-ce que je lance le mod�le complet avec les interactions et j'enl�ve une � une les interactions avec les plus fortes p_values ?
    Pour tester les interactions je fonctionne de la m�me mani�re que pour la s�lection des facteurs principaux. Donc une fois que j'ai mon mod�le complet, j'ajoute les interactions dans le mod�le ce qui donnera lieu � l'estimation de leur param�tre, ainsi qu'a leur significativit�. Tu as s�lectionn� tes effets principaux avec la m�thode backward, continues de s�lectionner tes interactions avec cette m�me m�thode (donc � partir du m�me tableau "estimations par analyse du maximum de vraisemblance", et des p_value qui s'y trouve).
    Personnellement quand j'introduis les interactions dans un mod�le, je lance le mod�le complet avec toutes les interactions possible, puis je les s�lectionne au fur et � mesure. Pour tester toutes les interactions d'un coup quand tu as d�j� beaucoup de variable, il y a une petite astuce qui t'�viteras d'�crire � la main toute les interactions :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    proc logistic data=projet.Bonami plots=all;                                                                                                                                                                              
    class Hta groupe_bis revasc Class_SEVERITY_0_H4 ;                                                                                                                                                              
    model evol_binaire(ref="1") = Hta | groupe_bis | revasc | tabac1 | tabac2 | Class_SEVERITY_0_H4 @2 /*pour tester les interactions de niveau 2*/ / selection=backward details;                                                                                                          
    test tabac1,tabac2;                                                                                                                                                                                            
    run;
    J'ai aussi rajout� l'option plots=all qui te permettra d'avoir un rendu visuel, notamment des odds-ratio, plut�t sympa...^^

    Voila je ne suis pas s�r de t'avoir vraiment aid�, mais disons qu'au moins cela aura le m�rite de relancer la conversation, et peut etre de finir par y attirer les expert du domaine

    Bon courage et bonne continuation !

    Guyguy

Discussions similaires

  1. R�ponses: 1
    Dernier message: 26/07/2012, 18h07
  2. R�gression logistique : test type 3
    Par joyeux_lapin13 dans le forum SAS STAT
    R�ponses: 2
    Dernier message: 21/05/2010, 11h03
  3. r�gression logistique et graphiques
    Par ebongue dans le forum SAS STAT
    R�ponses: 4
    Dernier message: 16/06/2009, 13h54
  4. r�gression logistique SAS
    Par sandrine_87 dans le forum SAS STAT
    R�ponses: 1
    Dernier message: 09/02/2009, 21h01
  5. R�ponses: 1
    Dernier message: 17/04/2007, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo