Hubert Wassner

Professeur d'informatique

25 03 2008

Cartographie sémantique de blogs

Voici une carte sémantique de blogs. Il s'agit de la deuxième version de cette carte, la première mouture avait déjà eu un certain succès, mais n'était pas cliquable ni très jolie... Cette nouvelle version contient plus de blogs, est cliquable et plus jolie (merci aux étudiants en projet pour cette mise en forme améliorée). Pour une rapide introduction au sujet ainsi qu'à la méthode utilisée voyez le premier article sur le sujet, ou regardez cette vidéo qui l'explique dans un contexte différent.

Notez que l'analyse sémantique (faite par un logiciel) regroupe automatiquement les blogs par thème : « high-tech », politiques, gastronomie, etc... On notera aussi l'importance de certain blogs d'un point de vue « connexion » entre les différents sous-groupe thématiques.

Voyez aussi la très bonne explication de Thomas sur son blog.

N'étant pas un super connaisseur de la blogosphère, je serai très content de lire vos commentaires avisés...

Si cet article vous a plus merci de voter en cliquant sur l'icone "wikio" pour le promouvoir.
Annexe(s) :
Notez ce billet : 11 vote(s)

Vous avez trouvez intéréssant ce billet? Abonnez-vous au flux RSS pour être tenu informé des prochains!

Trackbacks

Aucun trackback.

Les trackbacks pour ce billet sont fermés.

Commentaires

Le mercredi 26 mars 2008 à 10:46, par CathBK

Merci beaucoup pour votre présentation... et réalisation de cartographie... et toutes vos ressources... j'y reviendrai dès que possible plus longuement, CathBK

Le mercredi 26 mars 2008 à 22:45, par Sebastien

L'exercice de style est à saluer, cependant si vous souhaitez ajouter plus de valeur à cette carte je vous recommande de prendre le temps de visiter ces blogs un à un pour en identifier les thèmes et inscrire une couche supplémentaire de mapping de zone (flaques de couleurs différentes ?) sur celle-ci. Vous apporterez d'un part une validation du bon fonctionnement de l'algorithme de distanciation, et d'autre part une expertise humaine facilitant la lecture et l'interprétation directe de la carte.

Cordialement

Le mercredi 26 mars 2008 à 23:01, par Thomas Bouron

@Sebastien: Tout à fait d'accord avec vous, ce mapping de zone est une super bonne chose. MAIS nous souhaitons aboutir (du moins pour l'instant ou j'ai mal compris la première partie du sujet) à quelque chose d'automatique et automatiser ce processus est extrêmement compliqué car il faut passer par de la sémantique latente ce qui est une autre paire de manche. Cela demande aussi pas mal de calcul en plus.

Mais si cela se trouve, on arrivera à trouver un moyen détourné pour faire ça ;)

Le mercredi 26 mars 2008 à 23:40, par Hubert WASSNER

C'est effectivement une tâche à faire. Elle nécessite beaucoup de temps pour le faire et surtout pour en apprécier les détails. Voyez dans cet article où l'auteur analyse la position de son blog Ce genre d'analyse est très instructive. Nous espérons en avoir beaucoup d'autres. Cela aura aussi l'avantage de mesurer plusieurs avis. D'un point de vue plus scientifique, il est appréciable l'évaluation soit faite par des personnes différentes de celles qui ont réalisé l'objet à évaluer.

Comprenez donc que ces avis nous apporterons beaucoup pour une troisième version de la carte. Bloggeurs à vos claviers ;-)

Le jeudi 3 avril 2008 à 13:23, par Alesque

Bonjour,

Très sympa la carte :) Je note qu'il y a beaucoup de blogs concernant la nourriture, on est bien en France. Mais à par Econoclaste et le blog de Maitre Eolas, je ne vois pas ceux que je fréquente d'ordinaire. Pas étonnant outre mesure d'ailleurs. Je ne connais pas bien le vôtre alors je me risque à une question peut être "inutile", connaissez vous le blog "Les mots sont importants" ? (j'imagine que oui) Question plus technique : est-ce que dans votre domaine les normes sont équivalentes ?

Bonne journée ++

Le jeudi 3 avril 2008 à 17:22, par Hubert WASSNER

Les blogs choisit pour cette carte sont les 300 "top" blogs pris le sur le site web wikio. Tous n'apparaissent pas sur la carte car il ne sont sémantiquement proche d'aucun autre blog. On trouvait gênant de laisser dans la cartographie des zones non reliées au reste on ne les presente donc pas. Un seuil de représentativitée à été appliqué au mesures des distance pour produire la carte (sinon elle serai difficilement lisible). Pour une exploitation plus fine des résultats, on peut choisir un seuil spécifique à une thématique donnée et donc pouvoir cartographier plus précisément une zone.

Dit autrement la cartographie que vous voyez n'est q'une vue d'ensemble de la blogosphère francaise, donc assez naturellement certain "détails" ne sont pas visible.

On pourrait par exemple faire carte focalisée sur les blogs parlant du langage, et donc avoir une vision plus fine que celle actuellement proposé qui n'est qu'une vision généraliste (avec ses avantages et inconvenients).

Pour votre dernière question j'avoue ne pas bien en comprendre le sens. Pourriez vous la reformuler ?

Le vendredi 4 avril 2008 à 17:04, par versac

C'est assez bluffant. Et peut être interprêté de plusieurs manières.

Je prends mon cas et mes proches pour exemple. Les blogs que je lis et cite et aime : econoclaste, authueil, diner's room, radical chic, ... Blogs "du débat public", politiques et économiques, au registre de langage proche. Nous nous sommes d'ailleurs fédérés dans un agrégateur commun (lieu-commun.org). mais j'ai aussi un attachement à des sphères un poil plus technologique, et parle plus du web que mes congénères, ce qui fait que je m'en échappe un petit peu.

De fait, je trouve que les liens sémantiques transcrivent bien les liens de la vie réelle.

Le lundi 7 avril 2008 à 12:07, par Hubert WASSNER

Merci pour cette analyse précise et encourageante. Je serai très intéressé de construire avec votre aide une cartographie plus en détail de la blogosphère politique. Pour cela nous avons simplement besoin d'une liste de noms de blogs, c'est sur ce point que je compte sur vous, et nous nous chargerons de produire la carte... qu'en pensez vous ?

Le lundi 28 avril 2008 à 14:41, par Fabien

Vous pourriez rendre le résultat plus dynamique que du pdf en le mettant en ligne sous forme d'hypergraphe : (exemple) (homepage) En plus, le graphe pourrait être mis à jour automatiquement ou mieux dynamiquement, via un formulaire accessible au visiteur (nombre de blog, paramétrage des distances, etc). Cela donnerait un moyen aux visiteurs de faire une exploitation personnelle de vos données, voir même d'en proposer une nouvelle lecture.

Le mardi 29 avril 2008 à 21:34, par Hubert WASSNER

Merci pour ces liens. En effet ca me plait beaucoup, nous allons explorer cela. Il semble y avoir peu de docs mais si le code est aussi sobre que la présentation je pense qu'on doit pouvoir y arriver... Si vous maîtisez ces outils un coup de main serait le bienvenu...

Le mardi 10 mars 2009 à 02:26, par Evangenieur

Représentation graphique très sympa, mais avoir une exportation "Web Sémantique" du travail que vous avez effectué serait un grand plus si vous partagez ma vision me conduisant à prêcher la libration des données. (vision exposé sur <a href="http://evangenieur.com">mon blog Evangenieur.com</a> )

Ajouter un commentaire

Accéder à la charte des blogs?

Ce blog permet une syntaxe wiki simplifiée dans les commentaires. Si votre navigateur est compatible, vous pouvez vous aider de la barre d´outils. les adresses internet seront converties automatiquement. De plus, vous pouvez maintenant prévisualiser en direct votre commentaire (ci-dessus)