Blog
Soumis par Vincent Caillierez le mar, 07/10/2008 - 10:28
Afin de simplifier la gestion de mes sites, les blogs qui se trouvaient sur CrazyCresus.com et DrupalFrance.com ont été déplacés vers Felisite.com. Tous les anciens billets et les comptes utilisateur ont été conservés, et les URL sont redirigées automatiquement.
Le site CrazyCresus.com sera prochainement mis hors ligne. DrupalFrance.com restera en ligne mais traitera uniquement de la formation Drupal.
Pour vous abonner à ce blog, vous pouvez utiliser le lien ci-dessous :
http://feeds.feedburner.com/felisite
Soumis par felisite le ven, 03/10/2008 - 09:54
Afin de simplifier la gestion de mes sites, le blog DrupalFrance.com va être déplacé vers Felisite.com. Tous les anciens billets seront déplacés et les URL seront redirigées automatiquement. Si vous possédiez un compte sur DrupalFrance, il sera recréé sur Felisite.
Plus aucun billet ne sera publié sur ce blog, vous pouvez donc mettre à jour votre abonnement RSS en utilisant dorénavant le flux de http://felisite.com/.
Soumis par felisite le ven, 03/10/2008 - 09:54
Afin de simplifier la gestion de mes sites, le blog DrupalFrance.com va être déplacé vers Felisite.com. Tous les anciens billets seront déplacés et les URL seront redirigées automatiquement. Si vous possédiez un compte sur DrupalFrance, il sera recréé sur Felisite.
Plus aucun billet ne sera publié sur ce blog, vous pouvez donc mettre à jour votre abonnement RSS en utilisant dorénavant le flux de http://felisite.com/.
Soumis par felisite le ven, 03/10/2008 - 09:54
Afin de simplifier la gestion de mes sites, le blog DrupalFrance.com va être déplacé vers Felisite.com. Tous les anciens billets seront déplacés et les URL seront redirigées automatiquement. Si vous possédiez un compte sur DrupalFrance, il sera recréé sur Felisite.
Plus aucun billet ne sera publié sur ce blog, vous pouvez donc mettre à jour votre abonnement RSS en utilisant dorénavant le flux de http://felisite.com/.
Soumis par Vincent Caillierez le jeu, 24/04/2008 - 16:31
Le livre "Mining the Web: Discovering Knowledge from Hypertext Data" de Soumen Chakrabarti semblait plein de promesses. Malheureusement il n'a pas répondu à mes attentes.
Voici la présentation que l'éditeur fait du livre : "Ce livre est le premier qui soit consacré aux techniques permettant d'extraire de la connaissance de la vaste collection des données non structurées que l'on trouve sur le web. Chakrabarti passe d'abord en revue les questions d'infrastructure tel que le parcourt et l'indexation du web, puis il examine les techniques d'apprentissage automatique (machine learning) de bas niveau qui permettent d'exploiter les données du web (web mining)."
En d'autres mots, ce livre traite des techniques qui permettent de trouver automatiquement des données (ou pages) pertinentes sur le web. Il aborde les problématiques auxquelles sont confrontés les moteurs de recherche lors du parcours et de l'indexation des pages web : nombre énorme de pages à indexer, évolution permanente du corpus à indexer, rafraîchissement des pages déjà indexées... Puis il évoque les différentes façons d'effectuer une recherche à l'intérieur d'un corpus de documents indexés, via des requêtes SQL classiques ou grâce à plusieurs méthodes d'évaluation de la pertinence.
L'auteur aborde ensuite la notion de similarité et aggrégat (clustering) qui consiste en gros à regrouper des documents selon certaines thématiques. Cela permet d'optimiser les recherches sur des termes qui peuvent être hautement ambigu (par exemple, le terme "star" en anglais peut faire allusion aux étoiles dans le ciel, aux stars de cinéma, à l'hymne américain ("star spangled banner")...). En effet, on peut demander à l'utilisateur à quel "cluster" sa recherche appartient et optimiser les résultats retournés.
Il parle ensuite d'apprentissage supervisé (supervised learning), une technique qui consiste à associer à des documents uniquement des mots-clé appartenant à une certaine "classe" de mots-clé définis manuellement. On parle aussi d'apprentissage semi-supervisé (semi-supervised learning), une technique qui consiste à entraîner un moteur de recherche à rattacher des documents à des mots-clé pertinents en lui montrant un ensemble de documents déjà taggés sur lesquels se baser pour tagger les futurs documents.
Enfin, Chakrabarti évoque l'analyse des réseaux sociaux comme moyen d'obtenir des résultats encore plus pertinents. Il faut comprendre "réseaux sociaux" au sens large, c'est-à-dire le fait que les pages web se citent les unes les autres via des liens hypertexte, et que la source de la citation doit être prise en compte dans le classement du document cité (sur lequel le "prestige" de la source rejaillit en partie). Il parle également de l'importance de la "découverte des ressources", c'est-à-dire le fait d'indexer préférentiellement les pages importantes, les pages portant sur un sujet précis (considéré comme pertinent), ou les pages appartenant à une "communauté" (hub) de pages.
L'auteur conclut en évoquant le futur du web mining qui passe par l'extraction d'informations, la compréhension du langage naturel, la réponse aux questions posées en langage naturel...
Pourquoi je n'ai pas adoré ce livre
Je trouve que les sujets abordés par ce livre sont passionnants. Malheureusement, ils le sont de façon extrêmement universitaire. Le livre est truffé d'équations permettant de calculer la similarité entre deux documents ou la pertinence d'un document par rapport à une requête. C'est intéressant pour celui qui fait de la recherche ou celui qui cherche à développer son propre moteur de recherche, mais à mon niveau, mes attentes sont plutôt de comprendre les concepts de base du "web mining" et de trouver des outils prêts à l'emploi qui me permettront effectivement d'extraire des informations du web de façon automatique ou semi-automatique.
Les applications sont multiples, notamment la constitution automatique de bases de données (pour mon annuaire de PME par exemple), et le web mining est étroitement lié au web sémantique, aux web bots, aux agents intelligents... autant de sujets que je trouve passionnants. Malheureusement, ce n'est pas ce livre qui vous permettra de vous sentir plus à l'aise de ces domaines (à moins que vous ayez un bon profil d'informaticien pur).
Soumis par Vincent Caillierez le lun, 21/04/2008 - 13:24
Avant hier, le deuxième DrupalCamp a eu lieu à Paris et ça a été un franc succès.

Photo prise par elv
Tout d'abord, un grand merci à toutes les personnes qui ont rendu cet événement possible, notamment les organisateurs et les sponsors, mais aussi les participants (toutes les coordonnées sont sur http://barcamp.org/DrupalCampParis2Participants).
L'événement s'est déroulé à la Cantine, un lieu pas trop bruyant, avec plusieurs espaces de discussion distincts et du WiFi partout. C'était particulièrement adapté à ce genre d'événement.
Il y avait beaucoup plus de monde que lors du premier DrupalCamp Paris. Le site officiel annonce plus de 80 inscrits ; ce chiffre est difficile à vérifier mais on devait être pas loin de ce nombre-là de participants.
Selon le principe du BarCamp, plusieurs sessions se sont organisées autour de différentes thématiques comme "Découvrir Drupal", "Le staging d'un site Drupal", "L'organisation de la communauté Drupal francophone"... Plusieurs compte-rendus ont été publiés en ligne [impossible de trouver une URL, mais je sais qu'il y avait un wiki sur lequel plusieurs personnes ont posté au cours de la journée]. Vous trouverez également des photos dans l'album DrupalCamp Paris 08 sur Flickr.
J'ai finalement réussi à faire une interview vidéo de Michel Lévy Provençal sur l'utilisation de Drupal à France 24, je la publierai dans les prochains jours. D'autres personnes que j'aurais souhaité interviewer étaient présentes, mais nous n'avons malheureusement pas trouvé le temps...
Soumis par Vincent Caillierez le lun, 21/04/2008 - 13:24
Avant hier, le deuxième DrupalCamp a eu lieu à Paris et ça a été un franc succès.

Photo prise par elv
Tout d'abord, un grand merci à toutes les personnes qui ont rendu cet événement possible, notamment les organisateurs et les sponsors, mais aussi les participants (toutes les coordonnées sont sur http://barcamp.org/DrupalCampParis2Participants).
L'événement s'est déroulé à la Cantine, un lieu pas trop bruyant, avec plusieurs espaces de discussion distincts et du WiFi partout. C'était particulièrement adapté à ce genre d'événement.
Il y avait beaucoup plus de monde que lors du premier DrupalCamp Paris. Le site officiel annonce plus de 80 inscrits ; ce chiffre est difficile à vérifier mais on devait être pas loin de ce nombre-là de participants.
Selon le principe du BarCamp, plusieurs sessions se sont organisées autour de différentes thématiques comme "Découvrir Drupal", "Le staging d'un site Drupal", "L'organisation de la communauté Drupal francophone"... Plusieurs compte-rendus ont été publiés en ligne [impossible de trouver une URL, mais je sais qu'il y avait un wiki sur lequel plusieurs personnes ont posté au cours de la journée]. Vous trouverez également des photos dans l'album DrupalCamp Paris 08 sur Flickr.
J'ai finalement réussi à faire une interview vidéo de Michel Lévy Provençal sur l'utilisation de Drupal à France 24, je la publierai dans les prochains jours. D'autres personnes que j'aurais souhaité interviewer étaient présentes, mais nous n'avons malheureusement pas trouvé le temps...
Soumis par Vincent Caillierez le lun, 21/04/2008 - 13:24
Avant hier, le deuxième DrupalCamp a eu lieu à Paris et ça a été un franc succès.

Photo prise par elv
Tout d'abord, un grand merci à toutes les personnes qui ont rendu cet événement possible, notamment les organisateurs et les sponsors, mais aussi les participants (toutes les coordonnées sont sur http://barcamp.org/DrupalCampParis2Participants).
L'événement s'est déroulé à la Cantine, un lieu pas trop bruyant, avec plusieurs espaces de discussion distincts et du WiFi partout. C'était particulièrement adapté à ce genre d'événement.
Il y avait beaucoup plus de monde que lors du premier DrupalCamp Paris. Le site officiel annonce plus de 80 inscrits ; ce chiffre est difficile à vérifier mais on devait être pas loin de ce nombre-là de participants.
Selon le principe du BarCamp, plusieurs sessions se sont organisées autour de différentes thématiques comme "Découvrir Drupal", "Le staging d'un site Drupal", "L'organisation de la communauté Drupal francophone"... Plusieurs compte-rendus ont été publiés en ligne [impossible de trouver une URL, mais je sais qu'il y avait un wiki sur lequel plusieurs personnes ont posté au cours de la journée]. Vous trouverez également des photos dans l'album DrupalCamp Paris 08 sur Flickr.
J'ai finalement réussi à faire une interview vidéo de Michel Lévy Provençal sur l'utilisation de Drupal à France 24, je la publierai dans les prochains jours. D'autres personnes que j'aurais souhaité interviewer étaient présentes, mais nous n'avons malheureusement pas trouvé le temps...
Soumis par Vincent Caillierez le lun, 21/04/2008 - 13:24
Avant hier, le deuxième DrupalCamp a eu lieu à Paris et ça a été un franc succès.

Photo prise par elv
Tout d'abord, un grand merci à toutes les personnes qui ont rendu cet événement possible, notamment les organisateurs et les sponsors, mais aussi les participants (toutes les coordonnées sont sur http://barcamp.org/DrupalCampParis2Participants).
L'événement s'est déroulé à la Cantine, un lieu pas trop bruyant, avec plusieurs espaces de discussion distincts et du WiFi partout. C'était particulièrement adapté à ce genre d'événement.
Il y avait beaucoup plus de monde que lors du premier DrupalCamp Paris. Le site officiel annonce plus de 80 inscrits ; ce chiffre est difficile à vérifier mais on devait être pas loin de ce nombre-là de participants.
Selon le principe du BarCamp, plusieurs sessions se sont organisées autour de différentes thématiques comme "Découvrir Drupal", "Le staging d'un site Drupal", "L'organisation de la communauté Drupal francophone"... Plusieurs compte-rendus ont été publiés en ligne [impossible de trouver une URL, mais je sais qu'il y avait un wiki sur lequel plusieurs personnes ont posté au cours de la journée]. Vous trouverez également des photos dans l'album DrupalCamp Paris 08 sur Flickr.
J'ai finalement réussi à faire une interview vidéo de Michel Lévy Provençal sur l'utilisation de Drupal à France 24, je la publierai dans les prochains jours. D'autres personnes que j'aurais souhaité interviewer étaient présentes, mais nous n'avons malheureusement pas trouvé le temps...
Soumis par Vincent Caillierez le dim, 20/04/2008 - 11:21
J'ai créé CrazyCresus.com pensant faire un blog pratique sur le business web : on discute d'idées de sites web, on en réalise certaines, et en cours de route, on voit ce qui fonctionne ou pas. Mon objectif était de détailler les "coulisses" de la réalisation d'une idée, les difficultés techniques, financières ou administratives rencontrées... afin de pouvoir en faire profiter d'autres, de démarrer des discussions, et d'apprendre 2 ou 3 choses au passage.
Ca fait maintenant 2 mois que CrazyCresus existe. Quelques personnes m'ont dit ne pas très bien comprendre le sujet du blog : pourquoi ne parle-t-on pas d'une idée en particulier ? CrazyCresus lui-même est-il une idée de business ? (Non, c'est juste un blog sur les idées de business en général.) D'autres personnes m'ont contacté au sujet de certaines idées que j'ai évoquées, notamment le site de rencontre qui apparemment trotte dans la tête de pas mal de personnes.
Finalement, chaque idée est un business à part entière. Pas évident d'en lancer 4 ou 5 en même temps (ben oui, je viens tout juste de m'en rendre compte...). Il faudrait un peu de sous, pas mal de temps, et quelques personnes qui bossent avec moi. Nous n'en sommes pas encore là. :-)
Alors voici ce que je vous propose : je vais me concentrer sur une seule idée, l'annuaire de PME. Par rapport à cette idée, je vais me fixer des objectifs précis (par exemple, "gagner 50.000 euros") et une durée pour les atteindre (1 an). Je reviendrai sur les objectifs détaillés et le calendrier dans un prochain billet, mais l'idée est d'utiliser CrazyCresus comme un journal de bord, et de vous donner le plus possible d'infos pratiques sur la réalisation d'un tel projet. Comme tous les projets web présentent des caractéristiques communes, vous devriez pouvoir transposer ces infos à votre situation.
En parallèle, je continuerai à évoquer d'autres idées, ou tout simplement à suivre l'actualité du business web, mais juste pour enrichir la conversation.
PS. Il se trouve que c'est mon anniversaire aujourd'hui. Se fixer un an pour réaliser mon projet me fait donc une belle date symbolique. :-)
|