ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Enjeux et apports des recherches en humanités numériques
En savoir plus >>
Autres revues >>

Les Cahiers du Numérique

1622-1494
Les Cahiers du Num���������rique
 

 ARTICLE VOL 7/2 - 2011  - pp.63-84  - doi:10.3166/lcn.7.2.63-84
TITRE
PÉNALISATION DES MOTS FRÉQUENTS POUR LA CLASSIFICATION DE SENTIMENTS

RÉSUMÉ

Nous abordons dans cet article le problème de la classification de sentiments en utilisant des techniques d’apprentissage statistique supervisé. Nous étudions différentes combinaisons de fonctions coûts et de régularisations. Le principal problème de la classification de sentiments par rapport à la classification thématique se trouve au niveau de l’extraction de caractéristiques discriminantes. Nous montrons dans cet article que la régularisation classique (L1 ou L2) sélectionne des caractéristiques qui ne sont pas adaptées aux sentiments. Nous présentons une nouvelle méthode de régularisation en pénalisant les mots fréquents : cette méthode nous a permis d’obtenir de très bons résultats en détection de sentiment ainsi qu’en classification multidomaine sur plusieurs jeux de données de référence. Nous fournissons des analyses détaillées des résultats et des interprétations des modèles appris.



AUTEUR(S)
Abdelhalim RAFRAFI, Vincent GUIGUE, Patrick GALLINARI

LANGUE DE L'ARTICLE
Français

 PRIX
GRATUIT
   
ACCÉDER A L'ARTICLE COMPLET  (1,12 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier