del.icio.us daily blog post

La question m'ayant été posé plusieurs fois de la façon dont on peut intégrer ce qu'on met dans son compte del.icio.us, j'explique comment je m'y suis pris dans un post à part (la procédure peut changer à l'avenir, elle est valable aujourd'hui):

  1. se connecter à del.icio.us
  2. aller dans settings
  3. à droite dans Experimental, cliquer sur daily blog posting, ce qui vous amène à l'adresse http://del.icio.us/settings/mon_identifiant/daily
  4. Vous avez un formulaire qu'il convient de remplir comme suit:
    • job_name : Mon_delicious_quotidien [par ex]
    • out_name :morinn [votre login de blog; pour moi wordpress]
    • out_pass : ***** [votre mot de passe de blog]
    • out_url : https://morinn.wordpress.com/xmlrpc.php [càd url de votre blog + adresse xmlrpc]
    • out_time : 23 [l'heure GMT à laquelle vous voulez que ça tourne]
    • out_blog_id : [laisser blanc pour WordPress]
    • out_cat_id : 493 [ici le numéro ID de la catégorie dans laquelle vous voulez poster dans votre blog; j'ai pour ma part préalablement créé une catégorie del.icio.us, dont c'est le num. Si blanc, catégorie par défaut du blog, j'imagine]
Advertisements

June 14, 2006 at 1:28 pm Leave a comment

links for 2006-06-13

June 14, 2006 at 12:18 am 1 comment

Primo

Quelques notes avant d'oublier sur Primo. C'est un nouveau produit d'Ex Libris, qui devrait sortir à la toute fin de l'année 2006, déjà évoqué dans d'autres blogs: NeoArch et Schenizzle, qui ont assisté à la réunion du club utilisateur ex libris USA, ainsi que par les concurrents de Talis.
Primo est entièrement une interface publique, mais ce n'est pas un opac. Ce n'est pas un opac pour des raisons commerciales (que je ne discute pas ici), mais aussi pour des raisons techniques: Primo est séparé d'Aleph. C'est-à-dire: le SIGB est entièrement un outil de gestion interne, séparé de l'interface de consultation. Et de fait, dans les SIGB c'est souvent l'opac qui marche le moins bien, parce qu'il vient se greffer, difficilement, sur un outil fondamentalement conçu pour le catalogage et la gestion interne.

Primo moissone les données du SIGB, les copies dans une seconde base, qui lui est propre. Donc, la piste que je suivais dans un post précédent: sortir les données du SIGB pour faire une interface graphique dans une autre base n'est pas si folle, c'est exactement ce que fait Primo!

Primo, étant capable de moissonner, peut moissonner le SIGB, Aleph, ou tout autre ressource moissonnable: un autre SIGB (si vous n'avez pas Aleph), les thèses de HAL, d'ArXiv, etc.

Tout ce qui est récupéré dans la base Primo est remâché pour être proposé dans une interface publique qui a toutes les bells and whistles, comme on dit en Anglais, càd tous les deniers gadgets: rss à tous les étages, fenêtre de recherche simple à la google, un peu d'Ajax pour faire des suggestions orthographiques, etc.

Les grands principes mis en oeuvre dans l'interface sont:

  • FRBR, pour avoir non pas une liste de 10 entrées pour Don Quichotte édition française 2005, édition espagnole 1999, etc., mais une seule entrée regroupant les différentes éditions
  • facettes: quand vous avez une liste de résultat correspondant à la recherche "Ajax" on vous propose des liens pour parcourir l'ensemble résultat par les auteurs (les plus cités dans l'ensemble résultat), les sujets (informatique, mythologie, javascript, etc), les supports (livre, cd-rom…), etc.

Un peu dans l'idée de ce qu'on trouve sur le nouveau catalogue des bibliothèques de NCSU.

Primo exploite à fond, semble-t-il, les possibilités de récupération, manipulation des métadonnées de nos catalogues. Ce qui implique plusieurs choses:

  • comme on exploite mieux les données du catalogue, il devient beaucoup plus important que ces données soient de bonne qualité. Donc: il faut absolument améliorer la qualité du catalogue: FRBR n'a pas beaucoup de sens si vos notices décrivent, de façon erronée, vos DVD avec un format de notice BK (livre). Cela n'était pas le cas auparavant dans la mesure où de toute façon, livre ou dvd, l'affichage était le même; maintenant, ça compte.
  • si on coupe le lien entre SIGB, càd données, et interface publique, on peut faire une interface vraiment adaptée. Cela rend l'intégration dans diverses plateformes beaucoup facile. Cela permet aussi de faire des interfaces locales. D'ailleurs Primo n'est pas un "bloc": il y a des couches logicielles qui se superposent; on peut utiliser seulement la fonctionnalité qui récupère les données, les remâche; on peut par dessus utiliser son propre moteur (par ex Fast, c'est ce que font, je crois, les Allemands de HBZ) ou celui de Primo; on peut prendre le moteur de Primo mais ne pas prendre l'interface graphique.

June 13, 2006 at 10:36 am Leave a comment

links for 2006-06-12

June 13, 2006 at 12:20 am Leave a comment

python – progrès

Je l'ai dit en janvier, je crois, j'ai commencé à apprendre (seul avec mes petites main) la programmation en Python (pendant mon temps libre, ça va sans le dire).

J'ai laissé tombé pendant un long moment puis repris il y a environ un mois.

Comme il m'a toujours semblé plus facile d'apprendre quelque chose en pratiquant, j'ai un projet, que j'ai baptisé "AlephSuggest". Pas besoin d'être grand clerc pour deviner ce que j'envisage: récupérer mon catalogue en XML, en extraire les mots sujets, par ex., les écrire dans un fichier XML qui servira de base à un objet XMLHttpRequest pour faire AlephSuggest.

Un peu ambitieux pour un newbie, sans doute. On verra bien.

Ce que j'ai réussi à faire ce week-end (après env. 1 mois d'information générale sur Python -grâce aux excellents Dive into Python et How to Think like a Computer Scientist, Learning with Python et après 1 week-end de bricolage): extraire le texte des 610 d'une notice en XML.

Ma notice ressemble à ça:

<?xml version = "1.0" encoding = "UTF-8"?>
<record>
<record_header>
<set_entry>000000001</set_entry>
</record_header>
<doc_number>379711</doc_number>
<metadata>
<oai_marc>
<fixfield id="FMT">BK</fixfield>
<fixfield id="LDR">—–cam1-2200469-i-450-</fixfield>
<fixfield id="001">2006140431</fixfield>
<fixfield id="005">20060421110028.0</fixfield> <varfield id="010" i1=" " i2=" "> <subfield label="a">2-7314-0516-3</subfield>
<subfield label="b">Br.</subfield>
<subfield label="d">22.00 EUR</subfield>
</varfield>

[…]

<varfield id="610" i1="0" i2=" ">
<subfield label="a">droit des societes</subfield>
<subfield label="a">droit civil</subfield>
<subfield label="a">contentieux</subfield>
<subfield label="a">juridiction civile</subfield>
<subfield label="a">procedure civile</subfield>
</varfield>

[…]

</oai_marc>
</metadata>
</record>

Le but du jeu est de sortir de tout ça les textes des sous-champs du champs 610. En Python je fais ça:

>>> import sys
>>> from elementtree import ElementTree
>>> tree = ElementTree.parse("notice.xml")
>>> for node in tree.findall(".//varfield"): # gets the varfield tags

if node.get("id") == "610": # only gets varfield with 610, subject in Unimarc

print node.get("id") #prints the id just to make sure verything's all right

if node.getchildren(): # gets the subfields of varfield 610

for child in node: # loop: for each subfield..

print child.text # prints the text

Le résultat:

610
droit des societes
droit civil
contentieux
juridiction civile
procedure civile

Ces 9 lignes m'ont pris environ 8h de travail: j'ai eu une percée dimanche en buvant un whisky-coca et en me disant qu'il fallait utiliser ElementTree… C'est un début…

La suite:

  • en 610 il n'y a qu'un sous-champs a, mais en 606 je devrais pouvoir gérer a, j, x, etc
  • c'est sur une notice, il faut généraliser pour un ensemble de notices dans un même fichier: c'est-à-dire non pas s'arrêter au premier 610 rencontré, mais faire une boucle
  • gérer les caractères accentués

S'il y a des gens qui connaissent Python dans les parages… Toute aide est bienvenue

June 12, 2006 at 1:51 pm Leave a comment

formations du personnel

Avec un collègue on a mis au point, pour le premier trimestre de l'année universitaire prochaine, un cycle de formations du personnel.

Les séances durent environ 1h.

Le but est de sensibiliser le personnel à l'évolution des outils et des usages informatiques. Ce n'est pas forcément directement documentaire mais cela a toujours un impact sur la vie de la bibliothèque. Directement, par exemple avec OpenOffice, qui est sur les postes publics à la BU. Indirectement, parce que c'est l'environnement web dans lequel le public a l'habitude, maintenant, d'évoluer: par ex. Amazon.

Il y a une exception dans cette liste, c'est Thunderbird: c'est maintenant la messagerie par défaut et c'est donc une formation à l'outil de travail. 

Bref, il s'agit dans tous les cas d'être mieux à même de renseigner le public.

Le programme des formations prévues:

  • les fils RSS: Qu'est-ce que c'est? Comment lire un fil RSS? Exemples: le fil RSS des nouveautés de la BU, les fils RSS de table des matières sur les périodiques électroniques…
  • Comment les étudiants peuvent rediriger leurs adresses mails univ-angers.fr vers une adresse mail perso
  • La recherche pro dans ALEPH
  • Les moteurs de recherche web scientifiques (Google Scholar, Scirus, Windows Academic Live): explication et qq exemples de moteurs de recherche web libres qui "ciblent" les ressources de niveau universitaire sur le web.
  • Le Chat, messagerie instantanée. Les étudiants l'utilisent et pour répondre à leurs demandes, à défaut d'être parfaitement bilingue bibliothécaire-étudiant, il faut au moins comprendre leur environnement. Don: qu'est-ce que c'est? Comment ça marche? Un mode de communication comme un autre. On teste.
  • Thunderbird: comment utiliser correctement sa messagerie Thunderbird, et en particulier comment utiliser les filtres.
  • Qu'est-ce qu'un services de référence en ligne: principes de fonctionnement; un exemple.
  • OpenOffice – Texte. C'est le traitement de texte installé sur les postes publics de la bibliothèque, il faut pouvoir aider un minimum les usagers qui l'utilisent. Petit tour d'horizon de l'interface. Point particulier: ouvrir un document créé dans Word; enregistrer un document qui pourra être lu dans Word.
  • Amazon. Amazon vend (entre autres) des livres, qu'il propose dans un catalogue en ligne informatisé. Bref: un OPAC. Qu'est-ce qu'il a de plus (et de moins) que le nôtre… sachant que des outils commerciaux arrivent qui proposent aux bibliothèques des interfaces proches d'Amazon.
  • Les Wikis. Un wiki est un site web dans lequel tout le monde peut écrire. Comment ça marche? En quoi cela peut-etre utile, en complément de notre intranet, pour favoriser le travail collaboratif.
  • Le réseau Wifi à la BU: le wifi (réseau internet sans fil) est en cours d'installation dans les BU d'Angers. Quelques explications sur son fonctionnement pour pouvoir répondre aux usagers qui auraient des questions à ce sujet.
  • Les Clés USB. Qu'est-ce que c'est? Comment ça marche en général? Comment ça marche en particulier sur les postes publics de la BU.

June 12, 2006 at 10:21 am 7 comments

links for 2006-06-09

June 10, 2006 at 12:19 am Leave a comment

Older Posts Newer Posts


Feeds