''Caractérisation, Catégorisation, Classification''\n*On ''caractérise'' un type de chose(s) par la présence de certains attributs/propriétés/méthodes qui lui sont associés, ou des valeurs particulières de tels attributs. Une automobile a un moteur, des roues (en général 4), un volant etc. La caractérisation permet de reconnaître les choses a posteriori (dans les sciences de la nature) mais surtout de les décrire a priori (composants et structure d'un système technique, classes et méthodes d'un langage orienté objet). Dans une ontologie bien construite, les classes sont définies a priori par caractérisation : les instances d'une même classe partagent les mêmes propriétés caractéristiques. Les ontologies des sytèmes technologiques peuvent se construire autour de telles caractérisations a priori, et peuvent donc faire l'objet de consensus et de standards. \n*On ''catégorise'' la plupart du temps a posteriori. Les catégories peuvent s'appuyer sur des [[règles de catégorisation|Règles de catégorisation]] formalisées et qu'on peut implémenter, ou sur des concepts plus flous (musique baroque, personne amie, organisation terroriste, développement durable).\n*On ''classe'' pour organiser a posteriori les choses, ou les documents à propos des choses. Les classifications (ou taxonomies, par abus de langage) sont des organisations hiérarchiques de catégories, le classement est la mise en oeuvre pratique d'une classification. \n
Ceci n'est pas un blog, mais un bloc-notes. \nCeci n'est pas un site Web, mais une seule page dynamique. \nCeci n'est pas Web 2.0 : pas de commentaires, pas de flux RSS, quelques tags quand j'y pense, à usage interne seulement.\n*[[Comment çà marche?|Mode d'emploi]]\nCeci est le n-ième avatar de univers immedia\n*[[Pourquoi univers immedia?|univers immedia]]
[>img[soleil|images/mesangepetit.jpg]] \nHistorique\n*1999: Création du site [[univers immedia]] à l'adresse http://perso.wanadoo.fr/universimmedia\n*2000-2003: Tranfert du contenu sous le domaine universimmedia.com\n*2003: Abandon de universimmedia.com. Retour du contenu à l'adresse perso wanadoo\n*2003-2007: Site en dormance, peu de modification de contenu.\n*2004: Création du blog en anglais univers immedia, renommé récemment [[The wheel and the hub|http://universimmedia.blogspot.com]]\n*2007: Réactivation sous la forme actuelle avec la technologie [[TiddlyWiki|Mode d'emploi]]\nLes vieilles pages d'univers immedia\n*[[Le Soleil, une étoile pour la Vie | http://perso.orange.fr/universimmedia/soleil/]] : Le contenu original (1999-2003). \n*[[Petit Guide des Topic Maps| http://perso.orange.fr/universimmedia/topicmaps/]] (2000-2001). \n*[[Le principe non-hiérarchique dans l'organisation du Web| http://perso.orange.fr/universimmedia/nohi/nohi.htm]] (2000-2001)\n*[[Au Pays des Arbres| http://perso.orange.fr/universimmedia/arbres/]] : Créé en 2001 - en cours de réactivation par son jeune webmaster
L'agence [[dixxit|http://www.dixxit.fr]] a publié en février un excellent [[livre blanc|http://www.dixxit.fr/livre-blanc-referencement/]] intitulé sobrement "Référencement : la revanche du contenu". \nEn résumé : la meilleure stratégie pour le référencement, c'est la qualité du contenu éditorial, et les critères de qualité sont clairement identifiés. Plaisir de constater que certains ne sont pas sans rappeler quelques [[réflexions anciennes|http://perso.orange.fr/universimmedia/nohi/nohip5.htm]]. En particulier, la notion de richesse de l'''univers sémantique'' ouvre un vaste champ de réflexion. Quels rapports entre la sémantique ainsi définie, et celle du Web sémantique? Si les contenus construits selon les règles de l'art répertoriées par dixxit sont optimisés à la fois pour les internautes et les moteurs de recherches, on peut penser qu'ils le sont aussi pour les outils de traitement du langage naturel et d'extraction de connaissances. Donc de tels contenus devraient être plus facilement intégrables dans le Web sémantique, en améliorant la possibilité de génération automatique de métadonnées formelles cohérentes avec le contenu. Pas très loin, finalement, des principes de [[Linking Open Data]] : un contenu bien structuré possède une sémantique pré-formalisée, il est donc mûr pour être récolté et engrangé par les agents du Web sémantique. C'est peut-être le seul reproche qu'on puisse faire d'ailleurs au livre blanc de dixxit : l'absence de référence au Web sémantique, alors que la référence au Web 2.0 y est bien présente.
[[Résilience du Web (sémantique)]]\n[[L'air du temps]]\n[[Ontologies, Taxonomies, Langages, Sémantique, etc]]
Le Web sémantique sera social ou ne sera pas, le Web social a besoin de sémantique. C'est la conclusion que je tire de quelques semaines à tester [[Twine|http://www.twine.com/user/bernard]]. Les technologies en émergence devront donc gérer l'interaction des gens et des choses, avec un bon dosage d'automatisation et d'intervention humaine. Beaucoup d'idées et d'outils émergent, comme par exemple [[Scoutle|http://www.scoutle.com]] ou [[Faviki|http://faviki.com]]. \nPlus de détails sur [[Leçons de Choses|http://mondeca.wordpress.com/2008/05/26/le-printemps-est-social-semantique/]].
''plain-texte'' n.m. \nTexte simple, sans ornements. \nDu latin ''texo, texere, textus'', tisser, bâtir une trame, et par extension un récit, et ''planus'', simple, sans aspérités, sans détours. \nPar analogie avec ''[[plain-chant|http://fr.wikipedia.org/wiki/Plain-Chant]]'' et copié sur l'anglais ''plain text''.\nLe Web ne jure plus que par le media, l'hypermedia, <nowiki>YouTube</nowiki> devient un moteur de recherche bientôt plus prisé que Google, le propos n'attire plus s'il n'est soutenu par une image, ou encore mieux une vidéo. Contre cette marée d'images, je me soigne en écrivant dans [[DarkRoom|http://they.misled.us/dark-room]].\n
English is the secondary language used by univers immedia. Main language is [[French|FR]]\nMainly for technical stuff, links to semantic web lists, working groups, blogs ans the like
"Le sens est né de l'érosion des mots, les significations sont nées de l'érosion des signes."\n[[Jean Baudrillard|http://fr.wikipedia.org/wiki/Jean_Baudrillard]] - Amérique, 1986\n\nErosion = usure ou usage? [[lire plus|http://mondeca.wordpress.com/2008/06/26/monde-ouvert-ou-monde-ferme-deux-approches-de-lontologie/]]
Enfin j'ai un [[profil FOAF|foaf.rdf]] accessible aussi depuis le petit logo dans le menu de gauche. \nLe prétexte est l'utilisation des attributs définis dans la toute nouvelle ontologie de [[lingvoj.org]].\nPour naviguer dans le Web sémantique à partir de là, je conseille vivement de l'ouvrir avec l'extension [[Tabulator pour Firefox|http://dig.csail.mit.edu/2007/tab/]].
Français : langue par défaut utilisée par univers immedia\nLe contenu technique est en [[anglais|EN]] quand il renvoie à des discussions sur des forums anglophones\n
Related Project : [[Linking Open Data]]\n\nProblem: RDF lacks something between <nowiki>rdfs:seeAlso</nowiki> (annotation with no semantics at all) and <nowiki>owl:sameAs</nowiki> (too strong semantics). \nSome ideas for a "Resource Linking vocabulary" (RLK)\n*Answer [[here|http://simile.mit.edu/mail/ReadMsg?listName=Linking%20Open%20Data&msgId=14470]] from Richard Cyganiak (sees use cases for ''<nowiki>rlk:imports</nowiki>'', does not like the rest).\n\n''Idea#1''\n''<nowiki>rlk:similar</nowiki>'' and ''<nowiki>rlk:imports</nowiki>''\nTwo properties between <nowiki>rdfs:seeAlso</nowiki> and <nowiki>owl:sameAs</nowiki>\n*(<nowiki>a:foo</nowiki> <nowiki>rlk:similar</nowiki> <nowiki>b:bar</nowiki>) means that some elements of the description of <nowiki>b:bar</nowiki> might be added to the description of <nowiki>a:foo</nowiki>, without garantee of consistency of the resulting description. This property is not assumed to be symmetric.\n*(<nowiki>a:foo</nowiki> <nowiki>rlk:imports</nowiki> <nowiki>b:bar</nowiki>) means that any element of the description of <nowiki>b:bar</nowiki> should be added to the description of <nowiki>a:foo</nowiki>. \nAxioms\n*<nowiki>rlk:similar</nowiki> <nowiki>rdf:subPropertyOf</nowiki> <nowiki>rdfs:seeAlso</nowiki>\n*<nowiki>rlk:imports</nowiki> <nowiki>rdf:subPropertyOf</nowiki> <nowiki>rlk:similar</nowiki>\n*<nowiki>owl:sameAs</nowiki> <nowiki>rdf:subPropertyOf</nowiki> <nowiki>rlk:imports</nowiki>\n\n''Idea#2'' \n''<nowiki>rlk:imports</nowiki>'' with ''<nowiki>rlk:ImportedDescription</nowiki>'' and ''<nowiki>rlk:source</nowiki>'' \nSpecifies which elements of the description of b:bar are imported into the description of a:foo\n*<nowiki>a:foo</nowiki> <nowiki>rlk:imports</nowiki> <nowiki>_:b0</nowiki>\n*<nowiki>_:b0</nowiki> <nowiki>rdf:type</nowiki> <nowiki>rlk:ImportedDescription</nowiki>\n*<nowiki>_:b0</nowiki> <nowiki>rlk:source</nowiki> <nowiki>b:bar</nowiki>\n*<nowiki>_:b0</nowiki> <nowiki>b:someProperty1</nowiki> <nowiki>someValue1</nowiki>\n*<nowiki>_:b0</nowiki> <nowiki>b:someProperty2</nowiki> <nowiki>someValue2</nowiki>\n...\n\n
Il faudrait être encore plus simple,\nSi simple que l'on puisse entrer\nDans la simplicité du vent,\nDu soleil poussiéreux\nDu linge qui pantèle sur la corde sans se plaindre.\nIl n'y a pas de désespoir dans le monde,\nNi d'espoir.\nIl n'y a que la simplicité du vent,\nDu soleil,\nDu linge,\nDe la corde;\nIl n'y a que la simplicité de l'eau,\nSes vergetures d'accouchée;\nIl n'y a que l'eau,\nLe caillou,\nLa simple nécessité de brûler et de mourir.\nIl faudrait pouvoir entrer sans frémir\nDans les choses\nComme les choses\nEntrent dans les choses.\nPourquoi cette révulsion de notre cœur?\nPourquoi cet éternel énervement de nos nervures?\nLa pensée ne construit rien. Le sentiment nous épuise.\nNous serrons les dents et saignons\nSans accoucher.\nNous pianotons sur les choses\nComme une pluie dont chaque goutte\nAurait peur de se faire du mal.\nNous sommes les petits électrisés du monde,\nNous n'entrons pas.\n\n[[Jean Rousselot|http://fr.wikipedia.org/wiki/Jean_Rousselot]] - Les Moyens d'existence - Editions Rougerie, 1950
* [[Défense du plain-texte]]\n* [[WiserEarth]]\n* [[Erosion des signes]]\n* [[Il faudrait être encore plus simple]]\n* [[Des choses et des gens]]\n* [[Métrique du graphe social]]
[>img[Arctic Ice Extension|http://arctic.atmos.uiuc.edu/cryosphere/IMAGES/arctic.thumb.jpg][http://arctic.atmos.uiuc.edu/cryosphere/IMAGES/arctic.jpg]]\nUne image à mettre dans ses favoris, les explications sur [[cette page|http://arctic.atmos.uiuc.edu/cryosphere/]].\n\nEn septembre 2005, l'extension de la banquise arctique était tombée à un niveau record, à un peu plus de 4 millions de km². Ce minimum était déjà atteint le 9 août dernier, plus d'un mois avant la fin de la saison de fonte. \n\nFin août 2007, on est en-dessous des 3 millions de km², soit 25% de baisse par rapport à 2005, et la fonte peut durer encore quelques semaines, le minimum étant typiquement atteint à la mi-septembre.\n\nVoir aussi les longues discussions autour de ce sujet sur le site [[Real Climate|http://www.realclimate.org/index.php/archives/2007/08/arctic-sea-ice-watch/]].\n\n
Alistair Miles propose de définir une sémantique explicite de SKOS comme extension de la sémantique de RDFS. \n[[Proposition et discussion|http://lists.w3.org/Archives/Public/public-esw-thes/2007Feb/0025.html]] sur le forum SKOS.\nMême problème que pour la migration vers les ontologie RDFS et/ou OWL. On risque de voir des migrations de données se faire sur la base d'une structure de données sans trop se préoccuper de la sémantique. Comment faire comprendre la différence entre un vocabulaire RDF à sémantique formelle et un schéma XML ou un schéma de métadonnées.\nQuestions similaires aussi pour la [[sémantique du Dublin Core|La sémantique du Dublin Core]].
Le Dublin Core poursuit son évolution vers une sémantique de plus en plus formelle, en proposant un nouveau modèle général, et la définition en RDFS des "domain" et "range" de ses éléments.\nhttp://dublincore.org/documents/2007/02/05/abstract-model/\nhttp://dublincore.org/documents/2007/02/05/domain-range/\nCommentaires à venir - voir en particulier l'articulation avec [[SKOS|skos]] pour l'élément critique ''subject''.
Les projets [[dbpedia| http://www.dbpedia.org]] et [[Linking Open Data]] ont vite monté en pression et en visibilité depuis leur lancement au mois de janvier. A lire absolument cette excellente présentation du projet dbpedia, avec ses forces (infrastructure technique mature, scalabilité, noyau de cristallisation pour le Web sémantique) et ses faiblesses (interfaces et courbe d'apprentissage encore très techniques) :\n[[ Did You Blink? The Structured Web Just Arrived|http://www.mkbergman.com/?p=354]]
Quelques notes de lecture ...\n*[[What is Humanities Computing (and What is Not)?|http://www3.isrl.uiuc.edu/~unsworth/texas-hc.html]] - [[John Unsworth|http://www3.isrl.uiuc.edu/~unsworth/]] , 2002. Donne envie d'en lire plus du même.\n*[[Understanding Subjects and Subjects Proxies|http://www.durusau.net/publications/Understanding_Subjects_and_Subject_Proxies.pdf]]. Un papier très court et très clair par Patrick Durusau.
Un excellent [[billet|http://danbri.org/words/2007/11/21/228]] de Dan Brickley sur le Web sémantique dans le cadre d'un débat sur le "Shadow Web", le Web sémantique qui ne serait aux yeux de certains que l'ombre du Web des documents et des contenus. Selon danbri, l'ombre n'est pas forcément du côté qu'on croit. Les documents contiennent des points de vue, des éclairages divers sur le monde réel (les gens, les lieux, les événements, les planètes ...) et le réseau infiniment complexe de leurs relations. Donc les contenus du Web peuvent être vus comme les ombres portées de ce monde réel. Le Web sémantique ne fait qu'expliciter les éclairages et les objets projetés : "The Semantic Web is, on this story, not a shadow of the real Web, but a story about how the Web is a shadow of the world".
Une langue, c'est compliqué. Prenez le [[français| http://fr.wikipedia.org/wiki/Fran%C3%A7ais]]. Vous avez le français de France, celui de Belgique, celui de Suisse, celui du Québec. Et puis celui de Rabelais et celui de Molière et celui de Pérec. Une seule langue, ou plusieurs langues? Et encore elles utilisent le même alphabet. En chinois, en japonais ou en arabe, vous pouvez écrire avec les caractères traditionnels ou des transcriptions en caractères latins. \nLes langages <nowiki>XML</nowiki> utilisent l'attribut <nowiki>xml:lang</nowiki> dont la valeur utilise les 'language tags' définis [[ici|http://www.ietf.org/rfc/bcp/bcp47.txt]]. <nowiki>RDF-XML</nowiki> n'utilise ces attributs que pour définir la langue d'un 'label' ou d'un 'comment', qui ne sont que des 'annotations'. En fait les langues ne font pas partie de la sémantique du graphe RDF, ce ne sont pas des [[ressources| http://fr.wikipedia.org/wiki/Ressource_%28Web%29]].\nC'est une solution un peu courte pour une question aussi complexe. Donc il est temps de définir en RDF les langues comme des objets complexes, décrits par des attributs. Autrement dit des ressources à part entière, avec une sémantique. \n*Discussion sur le forum SKOS :\n**http://lists.w3.org/Archives/Public/public-esw-thes/2006Dec/0017.html\n**http://lists.w3.org/Archives/Public/public-esw-thes/2007Feb/0012.html\n*Propositions sur le ESW Wiki : [[Languages as RDF resources|http://esw.w3.org/topic/Languages_as_RDF_Resources]]\nVoir aussi : [[lingvoj.org]]
De plus en plus de gens publient ou rendent disponibles sur le Web des données en RDF, ou structurées de telle façon que leur migration en RDF peut être facilement automatisé. Par exemple les "infoboxes" des pages de [[Wikipédia]]. Données géographiques, sociales, environnementales, terminologiques, multimédia ... la liste est ouverte. Le but du projet [[Linking Open Data| http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData]] est de fédérer ces données pour former (enfin?) un noyau de Web sémantique en vraie grandeur.\nBeaucoup de questions intéressantes soulevées ([[Archives du Forum|http://simile.mit.edu/mail/BrowseList?listName=Linking%20Open%20Data]])\n*Objectifs recherchés: navigation, requêtes, raisonnement. Est-ce que la façon de relier les données favorise les uns plus que les autres?\n*Qualité des données reliées, filtrage des sources\n*Insuffisance des vocabulaires RDF actuels pour gérer finement les données liées. Trop de sémantique (<nowiki>owl:sameAs</nowiki>) ou pas assez (<nowiki>rdfs:seeAlso</nowiki>)\n*[[Some ideas about it...|IdeasForLinkingVocabulary]]
[img[images/cart-wheel_bigger.jpg][http://blog.hubjects.com]]\n[img[http://www.faviki.com/favicons/f240.ico][http://www.faviki.com/?s=172]] [img[images/foafTiny.gif][foaf.rdf]]\n [img[http://www.linkedin.com/img/webpromo/btn_liprofile_blue_80x15.gif][http://www.linkedin.com/in/bernardvatant]] \n\n[[Leçons de Choses| http://mondeca.wordpress.com]]\n[[Mondeca|http://www.mondeca.com]]\n\n[[Tags|tag]]\n[[Projets]]\n[[Lectures]]\n[[Publications]]\n[[Mode d'emploi]]\n[[A propos de]]\n[[Archives]]\n\n[img[WiserEarth|http://images.wiserearth.org/uploads/article/\n6f8e4a688fc5c5a4cafc63a629243c35/med_wiserearthlogo.jpg][http://www.wiserearth.org/user/bvatant]]\n[img[http://co2now.org/images/stories/widgets/co2_widget_rio_92.gif][http://co2now.org]]\n
[>img[tiddlywiki.org logo|http://trac.tiddlywiki.org/tiddlywiki/chrome/site/tworg_logo_med.jpg][http://www.tiddlywiki.org]]\nCe bloc-notes est basé sur la technologie [[Tiddly Wiki| http://www.tiddlywiki.com/]] qui permet de créer et éditer rapidement des pages web dynamiques de style Wiki. Une alternative sympathique pour un site web simple et vite fait, avec encore plus de flexibilité qu'un blog.\nLe bloc-notes est constitué d'une seule page dynamique, utilisable en navigation comme en édition. Rien à installer ni côté serveur, ni côté client. Le code est dans le contenu sous forme de javascript. La page est constituée de rubriques appelées "tiddlers" qu'on peut ouvrir et fermer à volonté, et dont les principales sont dans le menu à gauche. La navigation entre les rubriques se fait comme dans un wiki.\n\nSi les informations de cette page vous intéressent vous pouvez l'enregistrer et l'éditer hors-ligne avec un simple navigateur, comme dans un wiki. Si vous avez déjà utilisé un wiki en édition, vous apprendrez très vite. Firefox est recommandé, avec certains navigateurs vous ne pourrez pas sauvegarder les modifications. \nAttention! Pour sauvegarder cette page, il vaut mieux cliquer avec le bouton droit [[ici| http://perso.orange.fr/universimmedia/index.htm]] et choisir "enregistrer la cible du lien sous" pour obtenir une copie intégrale de cette page, y compris tout le code nécessaire à son édition. L'option "enregistrer la page sous" ne fonctionne pas forcément bien dans tous les navigateurs.
J'ai finalement cédé à la mode générale des réseaux sociaux. Depuis deux mois je suis sur [[Linked In|http://www.linkedin.com/in/bernardvatant ]], comme bientôt 20 millions de personnes. A quoi ça sert? Je ne sais pas trop encore. A minima, mettre à jour ma mémoire et mon carnet d'adresses, les gens changeant vite de situation et d'emploi par les temps qui courent. Découvrir aussi des gens partageant mes intérêts parmi les amis de mes amis. Et puis depuis que [[Yahoo!|http://www.ysearchblog.com/archives/000527.html]] a annoncé la semaine dernière qu'il indexerait les métadonnées RDF, en citant justement l'exemple de Linked In, c'était peut-être le bon moment.\nLa métrique du graphe est aussi un sujet de réflexion. Quel est le "bon" nombre de connections? Il me semblait à vue de nez qu'une centaine de connections directes était un bon chiffre. Les [[études de référence|http://fr.wikipedia.org/wiki/Nombre_de_Dunbar]] sur ce sujet proposent 150. Au-delà, on tombe dans le syndrome du collectionneur de liens. De façon surprenante, au fur et à mesure de la croissance de mon réseau, j'ai constaté que le rapport entre le nombre de connections au degré 3 et le nombre de connections au degré 2 reste effectivement de cet ordre de grandeur avec une remarquable constance (à quelques unités près). Le rapport degré 2 à degré 1 est un peu plus faible (de l'ordre de 60), soit à cause des liens redondants, soit que j'évite la connection avec les networkers professionnels.\nComme 100*5 = 10 milliards, on arrive théoriquement en 5 liens à couvrir la population du monde entier. Bien sûr il y a des liens redondants, mais pour la beauté de l'exercice on peut calculer plus précisément. Aujourd'hui la population mondiale est de l'ordre de 6,7 milliards, soit un peu plus de 92*5. On en déduit une métrique optimale pour un réseau social, qui mettrait en théorie tout le monde à distance 5, soit un pas de moins que dans la fameuse théorie des [[six-degrees|http://en.wikipedia.org/wiki/Six_degrees_of_separation ]].\n\nUne grosse centaine de connections directes - ma tribu\nEnviron 8 000 connections au degré 2 - ma cité - je connais tout le monde, directement ou indirectement.\nEnviron 800 000 connections au degré 3 - ma région - je ne connais pas tout le monde, mais nous avons suffisamment en commun pour nous réclamer d'une identité communautaire.\nEnviron 70 000 000 connections au degré 4 - mon pays - ou le réseau entier d'ici quelques temps.\nEt au degré 5 l'humanité entière, en supposant que chaque humain connait au moins une personne dans le réseau.\n\nMon réseau Linked In pour les degrés 1, 2 et 3 atteint à peu près ces valeurs optimales en ce moment. Je vais donc essayer de le maintenir dans ces chiffres. Un exercice de croissance zéro ...
Discussion la semaine dernière dans le cadre du projet [[dafoe4app|http://dafoe4app.fr]]. Deux points de vue sur les ontologies.\n[[Bruno Bachimont|http://www.utc.fr/~bachimon/index.html]]: En science (médecine et biologie en particulier), une ontologie est un modèle jetable destiné à tester la cohérence d'un point de vue sur un domaine de la connaissance. Les incohérences détectées ouvrent la voie à de nouvelles recherches. L'utilité des ontologies, comme des théories scientifiques, résiderait donc dans leur [[réfutabilité|http://fr.wikipedia.org/wiki/R%C3%A9futabilit%C3%A9]].\n[[Guy Pierra|http://www.lisi.ensma.fr/pagepersogenerique.php?nom=PIERRA&prenom=Guy]]: Dans l'industrie, une ontologie est un modèle destiné à permettre l'interopérabilité entre systèmes d'information. On recherche donc avant tout la pérennité et la stabilité.\nVieux débat : la science passe son temps à construire des modèles pour mieux les invalider, l'industrie construit sur des modèles, valides ou non.\n
*[[Vers une sémiotique générale]]\n*[[Métrique du graphe social]]\n*[[Les Ombres du Web]]\n*[[lingvoj.org]]\n*[[FOAF]]\n*[[Ontologies : jetables ou durables?]]\n*[[Caractérisation, Catégorie, Classification|3C]]\n*[[Sémantique(s) des URI]]\n*[[Le Web structuré est en route]]\n*[[Contenu, sémantique et métadonnées]]\n*[[Taxonomie et Ontologie]]\n*[[Règles de catégorisation]]\n*[[Linking Open Data]]\n*[[Les langues en RDF]]\n*[[La sémantique de SKOS]]\n*[[La sémantique du Dublin Core]]
Projets auxquels je participe en ce moment à des titres divers\n*Projets financés dans lesquels [[Mondeca|http://www.mondeca.com]] est partenaire.\n**[[Transitioning Applications to Ontologies| http://en.wikipedia.org/wiki/Transitioning_Applications_to_Ontologies]] : Projet Européen dans le cadre du sixième programme-cadre. Comment assurer la transition des bases de données et autres systèmes documentaires à des systèmes à base d'ontologie et des architectures orientées service (SOA)?\n**''Terradata'' et ''Eiffel''. Accès intelligent et multimédia à l'nformation territoriale et touristique ... [[en savoir plus| http://www.mondeca.com/capelink/fr/RetD.html]]\n*Projets Web sémantique, communautés, partage des connaissances ...\n**[[SKOS|skos]]\n**[[Geonames| http://www.geonames.org]] : Plus de 6 300 000 objets géolocalisés, accessibles par Web services, éditables en ligne par une interface Wiki. Je collabore pour l'ontologie permettant de publier ces données en RDF\n**[[Linking Open Data]]\n**... et bien sûr [[Wikipédia]]
Publications pour des conférences internationales (en anglais)\n*[[Managing complex environments with Topic Maps| http://www.mondeca.com/BernardVatantKT2001paper.htm]] - [[Knowledge Technologies Conference| http://www.gca.org/attend/2001_conferences/kt_2001/]], Austin, 2001.\n*[[Binding points for subject identity| http://www.mondeca.com/extreme2001.htm]] - [[Extreme Markup Conference| http://www.extrememarkup.com/extreme/]], Montréal, 2001.\n*[[A formal model for Topic Maps| http://www.mondeca.com/aformalmodelfortm.pdf]] (co-auteurs Pascal Auillans, Patrice Ossona de Mendez, Pierre Rosenstiehl) - [[International Semantic Web Conference| http://iswc.semanticweb.org/]], Sardaigne, 2002.\n*[[Re-using technical documents beyond their original context| http://www.idealliance.org/papers/xmle02/dx_xmle02/papers/02-01-04/02-01-04.html]] - XML Europe, Madrid, 2002.\n*[[Ontology-driven topic maps| http://www.idealliance.org/papers/dx_xmle04/papers/03-03-03/03-03-03.html]] - XML Europe, Amsterdam, 2004.\n\nPrésentations en français\n*[[Intégration sémantique, standards et langages|http://www.xml-france.asso.fr/association/uploads/media/mondeca-standard-semanticweb.pdf]], XML France 2005\n\nPublications internes Mondeca\n*[[La Roue et le Vide| http://www.mondeca.com/lab/bernard/roue_vide.pdf]]. Une approche de l'intégration sémantique (janvier 2006)\n
Catégorie = sujet (Dublin Core, Topic Maps) = concept (SKOS) = rubrique de taxonomie = entrée d'index = rayon de la bibliothèque = tag = ... \nautant de variantes d'un principe vieux au moins comme la bibliothèque d'Alexandrie. Un corpus/univers de ressources (physiques, documentaires, au sens RDF du terme ...) et on les affecte à des catégories/rubriques de classement/indexation. \nIdées en vrac:\n*Une ''règle de catégorisation'' s'appuie sur le contenu de la ressource (text mining, moteur plein texte) et/ou sur sa description (métadonnées) pour calculer automatiquement ou proposer au documentaliste l'affectation d'une ressource à une catégorie.\n*Les règles peuvent être exécutées en cascade. La catégorisation X peut s'appuyer sur les catégories déjà établies par Y. Exemple : ce que X a classé dans A,B ou C, Y le classera dans E.\n*La catégorisation est un processus. Tout ensemble de valeurs d'une métadonnée peut définir une catégorie. Exemple : Ma catégorie "Objet bleu" = catégorie des objets dont une métadonnée de type "couleur" a une valeur dans la bande bleue du spectre. Inversement, une fois affectée, une catégorie est considérée comme une métadonnée. \n*Un même univers/corpus de ressources s'organiser suivant un nombre arbitraire de taxonomies, personnalisées par l'utilisateur. \n*Langages cibles : [[SKOS|skos]] pour la représentation des taxonomies, [[SPARQL]] pour les règles de catégorisation, si le corpus est décrit en RDF.\n
Le Web a-t-il les capacités de résilience de la vie? Difficile de juger après seulement vingt années d'existence, alors que l'architecture du vivant a fait ses preuves par plusieurs milliards d'années de résistance aux cataclysmes les plus divers. L'infrastructure matérielle du Web, le réseau Internet a une résilience assez forte a priori par sa structure en réseau et la multiplication des serveurs. Les données ont elles aussi une forte résilience grâce à la facilité de duplication infinie. La meilleure façon de faire perdurer une donnée ou un savoir est de les mettre sur un réseau. Voir Wikipedia ...\n\nMais avec l'avènement du Web sémantique on peut s'interroger sur la capacité de résilience des concepts identifiés par des URI. Qu'arrive-t-il si le propriétaire d'une URI représentant un concept cesse de la maintenir, par exemple en ne renouvelant pas son nom de domaine ou son hébergement, ou simplement par l'usure normal des choses? Le concept disparait-il du Web? Non, si le Web sémantique s'organise de façon analogue au vivant, c'est-à-dire en copiant-dupliquant et multipliant les URI représentant le même concept, ce qui est inévitable. J'ai pendant un temps soutenu comme beaucoup d'autres le point de vue selon lequel il valait mieux éviter cette multiplication des URI représentant la même chose, tout en la sachant inévitable. En considérant qu'un concept est similaire à une espèce vivante, chaque URI, et la description qui l'accompagne à son adresse, est un représentant individuel de cette espèce sémantique. L'architecture du vivant est fondée sur le principe de base que tous les individus sont mortels, et qu'il faut donc multiplier et reproduire les individus. \n\nIl semble que ce principe imprègne déjà le Web sémantique, même si c'est de façon non réfléchie. \nVoir par exemple http://sameas.org/html?uri=http://www.lingvoj.org/lang/zh
le bloc-notes de Bernard Vatant
univers immedia
Un [[long débat|http://lists.w3.org/Archives/Public/semantic-web/2007Jun/0022.html]] sur un sujet inépuisable : \nQue représente/dénote une URI? Une URI peut-elle avoir des sémantiques différentes dans différents contextes? \nComment savoir si deux URI représentent ou non la même "chose", et comment l'exprimer? \nUsage et abus de <nowiki>owl:sameAs</nowiki>, en particulier dans le cadre de [[Linking Open Data]].\nA l'affiche [[Tim Berners-Lee|http://lists.w3.org/Archives/Public/semantic-web/2007Jun/0163.html]] et [[Pat Hayes|http://lists.w3.org/Archives/Public/semantic-web/2007Jun/0134.html]] dont le point de vue (minoritaire) continue à me convaincre.
*''Taxonomie'' (sens moderne) : organisation hiérarchique de rubriques, destinée à classer des ressources. \n**Langage de représentation : [[SKOS|http://www.w3.org/2004/02/skos/]]\n*''Ontologie'' (sens moderne) : représentation formelle d'un domaine de connaissance. \n**Langage de représentation : [[OWL|http://www.w3.org/2004/OWL/]]\nQuelques questions à la frontière :\n*Cas particulier : Des ressources (bases de connaissance, corpus documentaires) décrites par des métadonnées, définies par des ontologies qui peuvent être arbitrairement complexes, gérées pour et par les experts du "back-office". Comment filtrer cette connaissance et la présenter via des taxonomies de navigation ou de publication, proposant à l'utilisateur final une vue de ces mêmes ressources, à la fois simplifiée et adaptée à ses besoins particuliers? Un exemple de prototype développé par Mondeca : le portail [[Nièvre en Bourgogne|http://recherches.nievre-tourisme.com/]].\n*Cas général : Nécessité d'une vision globale de la notion de [[Règles de catégorisation]]. \n
Le Pentagone va donc probablement détruire dans les jours qui viennent son satellite-espion incontrôlable [[USA 193| http://fr.wikipedia.org/wiki/USA_193]] par tir de missile, juste avant sa désintégration "naturelle" par retombée dans l'atmosphère. Les hypothèses vont bon train sur les raisons profondes de cette action (militaires, stratégiques), les considérations de risque pour l'environnement invoquées par le Pentagone laissant beaucoup de monde sceptique.\nCe qui est vraiment intéressant, mal éclairci et peu discuté dans cette affaire, ce sont les conséquences prévisibles en termes de débris spatiaux. L'hypothèse que j'avance ici est que le risque d'ajouter à la densité de débris en orbite, qui atteint déjà un niveau critique, est largement plus important que les risques liés à la retombée. Les autorités compétentes prétendent que vue l'altitude à laquelle aura lieu l'interception, "la plupart des débris" retomberont dans l'atmosphère en quelques semaines. On se demande sur quel(s) modèles de telles affirmations s'appuient. Il est sans doute à peu près impossible d'évaluer la répartition en masse et en vitesse initiale des débris générés par l'interception. Si effectivement un bon nombre sera précipité dans l'atmosphère et détruit par l'élévation de température comme tous les débris cosmiques de petite taille, un nombre à peu près impossible à évaluer sera éjecté "vers le haut" selon des trajectoires imprévisibles. Les débris du satellite chinois détruit l'an dernier à une altitude de 850 km se répartissent maintenant entre 200 et 2000 km d'altitude, avec un pic de densité bien sûr au voisinage de l'orbite d'origine. Voir [[Orbital Debris Quarterly News| http://www.orbitaldebris.jsc.nasa.gov/newsletter/pdfs/ODQNv12i1.pdf]].\nCertes l'interception aura lieu cette fois beaucoup plus bas, vers 250 km d'altitude, et donc les conséquences en termes de débris ne sont pas a priori comparables. De là à dire qu'ils sont négligeables, c'est aller vite en besogne. \n*Lire aussi : \n**[[Arms Control Wonk : Don't Shoot Down USA 193|http://www.armscontrolwonk.com/1796/dont-do-it]]\n**[[Slashdot : USA 193 Shootdown Set For Feb 21, 03:30 UTC| http://science.slashdot.org/article.pl?sid=08/02/19/018224]]
Il est temps de lire ou relire [[Saussure|http://fr.wikipedia.org/wiki/Ferdinand_de_Saussure]], [[Pierce|http://fr.wikipedia.org/wiki/Charles_Sanders_Peirce]], et d'appliquer une analyse sémiotique générale à l'ensemble de nos systèmes d'information et des signes qu'ils échanges et manipulent. Dialogues avec le monde par les langages de la science, les représentations symboliques ou les logiques de description, dialogues entre systèmes vivants (humains ou animaux) par les langages naturels et les représentations sociales, dialogues entre machines par les langages formels peuvent être intégrés dans une telle approche, de même que les interfaces entre ces différents univers linguistiques. Pour cela, il faudrait passer du "Everything is a Thing" des langages du Web sémantique, et du [[réalisme un peu naïf|http://lists.w3.org/Archives/Public/semantic-web/2008Jul/0078.html]] sous-jacent à cette formule, à un "Everything is a Sign" qui serait le slogan d'un Web sémiotique à inventer.
Je suis contributeur épisodique et vélléitaire de Wikipédia anglais et français depuis le tout début (2001).\n*Wikipedia anglais: [[User Universimmedia| http://en.wikipedia.org/wiki/User:Universimmedia]]\n*Wikipédia français: [[Utilisateur Universimmedia| http://fr.wikipedia.org/wiki/Utilisateur:Universimmedia]]\nArticles créés ou suivis dans les deux langues:\n*[[SKOS| http://fr.wikipedia.org/wiki/SKOS]]\n*[[Ressource Web| http://fr.wikipedia.org/wiki/Ressource_%28Web%29]]\n*[[Ressource anonyme|http://fr.wikipedia.org/wiki/Ressource_anonyme]]\n\n
On est sur Facebook ou <nowiki>MySpace</nowiki> (je n'y suis pas) pour montrer qu'on est sociable, sur <nowiki>LinkedIn</nowiki> pour montrer qu'on est professionnel, sur Twine (je n'y suis plus) pour montrer qu'on est intelligent et branché. On est sur <nowiki>WiserEarth</nowiki> (j'y suis) si on croit qu'un autre monde est possible, plus beau, plus sage, plus respectueux de la vie sous toutes ses formes, plus moral, plus juste, et qu'on y travaille. Les <nowiki>WiserEarthlings</nowiki> sont encore peu nombreux (moins de 20,000) et moins bruyants que les réseaux sociaux capitalisés à milliards de dollars. Mais ils représentent les nouvelles utopies en action.
Outils communautaires, Semantic Web, Web 2.0 ...\nLe Web comme espace de partage des connaissances ...
Ce que contiennent les pages Web : contenu éditorial, texte, multimédia ... Par opposition aux métadonnées.
Choses en gestation, en rêve, en devenir
''23'' [[langues officielles|http://ec.europa.eu/education/policies/lang/languages/index_fr.html]] dans la Communauté Européenne\n''249'' langues dans [[Wikipedia|http://meta.wikimedia.org/wiki/List_of_Wikipedias]]\n''6912'' langues répertoriées par [[Ethnologue|http://www.ethnologue.com/]]\nCe bloc-notes n'utilise que ''2'' langues : [[EN]] et [[FR]]\n
Lingvoj veut dire "langages" en Esperanto. C'est le nom de domaine que j'ai choisi pour publier en RDF les noms des langues, récupérés automatiquement à partir des ressources des Wikipedia multilingues. \nA visiter si vous vous demandez comment on dit "Danois" en Chinois ou "Arabe" en Polonais.\nMise à jour le 12/09/2007 : une petite ontologie permettant d'utiliser les langues dans son profil [[FOAF]], et près de 8000 noms pour environ 200 langues.\n*http://www.lingvoj.org\nVoir aussi : [[Les langues en RDF]]
Choses passées, vieilles publications, archives ...
Projets ou lectures en cours, actualité ...
[[Simple Knowledge Organisation System| http://www.w3.org/2004/02/skos/]]\nSKOS est un vocabulaire RDF pour la représentation des Thesaurus, Index, Taxonomies ... \nEn voie de finalisation par le <nowiki>W3C</nowiki>, mais le coeur est déjà stable et utile.\nLe moyen de migrer sans courbe d'apprentissage trop dure une grande quantité de vocabulaires vers RDF.\n\n
La signification des choses ...\nForme Web de la métaphysique ...
Point de départ de la [[tagsonomie]].\nUne caractéristique sympathique de Tiddly Wiki est qu'il n'y a pas de limite à la récursivité. \nOn peut étiqueter les étiquettes ad libitum. Par exemple [[tag]] est un [[tag]], qui porte le tag [[technologie]].\n
Classification basée sur la pose de tags ou étiquettes. \nEtymologie : jeu de mots sur tag / taxonomie.\nEquivalent populaire : "folksonomie".\nToute la théorie est [[ici|http://tagsonomy.com/]]
Sous cette étiquette les outils, trucs et astuces de la machine Web.\n
[>img[Solar Data Analysis Center|http://umbra.nascom.nasa.gov/images/latest_trace_171_thumbnail.gif][http://umbra.nascom.nasa.gov/]] \nAu départ, univers immedia était le nom de code d'un projet des années 1997-1999. \nIl s'agissait d'un observatoire multimédia du [[Soleil|soleil/index.htm]], où on aurait donné à voir et comprendre au public la vie de notre étoile, le centre de notre ''univers immédiat'', en direct (en fait en très léger différé : 8min10s de trajet de la lumière entre le Soleil et la Terre) grâce à toutes sortes d'instruments captant le rayonnement solaire, et en différé un peu plus important grâce aux [[images et données des observatoires|http://www.solarmonitor.org/]] au sol et dans l'espace. \nDe ce projet aventureux qui ne fut pas mené à bien faute de financement, reste le nom, et le contenu du site web qui devait l'accompagner. Voir l'historique détaillé dans les [[archives|Archives]].