Archive for June, 2006

python - progrès

Je l'ai dit en janvier, je crois, j'ai commencé à apprendre (seul avec mes petites main) la programmation en Python (pendant mon temps libre, ça va sans le dire).

J'ai laissé tombé pendant un long moment puis repris il y a environ un mois.

Comme il m'a toujours semblé plus facile d'apprendre quelque chose en pratiquant, j'ai un projet, que j'ai baptisé "AlephSuggest". Pas besoin d'être grand clerc pour deviner ce que j'envisage: récupérer mon catalogue en XML, en extraire les mots sujets, par ex., les écrire dans un fichier XML qui servira de base à un objet XMLHttpRequest pour faire AlephSuggest.

Un peu ambitieux pour un newbie, sans doute. On verra bien.

Ce que j'ai réussi à faire ce week-end (après env. 1 mois d'information générale sur Python -grâce aux excellents Dive into Python et How to Think like a Computer Scientist, Learning with Python et après 1 week-end de bricolage): extraire le texte des 610 d'une notice en XML.

Ma notice ressemble à ça:

<?xml version = "1.0" encoding = "UTF-8"?>
<record>
<record_header>
<set_entry>000000001</set_entry>
</record_header>
<doc_number>379711</doc_number>
<metadata>
<oai_marc>
<fixfield id="FMT">BK</fixfield>
<fixfield id="LDR">—–cam1-2200469-i-450-</fixfield>
<fixfield id="001">2006140431</fixfield>
<fixfield id="005">20060421110028.0</fixfield> <varfield id="010" i1=" " i2=" "> <subfield label="a">2-7314-0516-3</subfield>
<subfield label="b">Br.</subfield>
<subfield label="d">22.00 EUR</subfield>
</varfield>

[...]

<varfield id="610" i1="0" i2=" ">
<subfield label="a">droit des societes</subfield>
<subfield label="a">droit civil</subfield>
<subfield label="a">contentieux</subfield>
<subfield label="a">juridiction civile</subfield>
<subfield label="a">procedure civile</subfield>
</varfield>

[...]

</oai_marc>
</metadata>
</record>

Le but du jeu est de sortir de tout ça les textes des sous-champs du champs 610. En Python je fais ça:

>>> import sys
>>> from elementtree import ElementTree
>>> tree = ElementTree.parse("notice.xml&quot ;)
>>> for node in tree.findall(".//varfield"): # gets the varfield tags

if node.get("id&quot ;) == "610": # only gets varfield with 610, subject in Unimarc

print node.get("id&quot ;) #prints the id just to make sure verything's all right

if node.getchildren(): # gets the subfields of varfield 610

for child in node: # loop: for each subfield..

print child.text # prints the text

Le résultat:

610
droit des societes
droit civil
contentieux
juridiction civile
procedure civile

Ces 9 lignes m'ont pris environ 8h de travail: j'ai eu une percée dimanche en buvant un whisky-coca et en me disant qu'il fallait utiliser ElementTree… C'est un début…

La suite:

  • en 610 il n'y a qu'un sous-champs a, mais en 606 je devrais pouvoir gérer a, j, x, etc
  • c'est sur une notice, il faut généraliser pour un ensemble de notices dans un même fichier: c'est-à-dire non pas s'arrêter au premier 610 rencontré, mais faire une boucle
  • gérer les caractères accentués

S'il y a des gens qui connaissent Python dans les parages… Toute aide est bienvenue


Add comment June 12, 2006

formations du personnel

Avec un collègue on a mis au point, pour le premier trimestre de l'année universitaire prochaine, un cycle de formations du personnel.

Les séances durent environ 1h.

Le but est de sensibiliser le personnel à l'évolution des outils et des usages informatiques. Ce n'est pas forcément directement documentaire mais cela a toujours un impact sur la vie de la bibliothèque. Directement, par exemple avec OpenOffice, qui est sur les postes publics à la BU. Indirectement, parce que c'est l'environnement web dans lequel le public a l'habitude, maintenant, d'évoluer: par ex. Amazon.

Il y a une exception dans cette liste, c'est Thunderbird: c'est maintenant la messagerie par défaut et c'est donc une formation à l'outil de travail. 

Bref, il s'agit dans tous les cas d'être mieux à même de renseigner le public.

Le programme des formations prévues:

  • les fils RSS: Qu'est-ce que c'est? Comment lire un fil RSS? Exemples: le fil RSS des nouveautés de la BU, les fils RSS de table des matières sur les périodiques électroniques…
  • Comment les étudiants peuvent rediriger leurs adresses mails univ-angers.fr vers une adresse mail perso
  • La recherche pro dans ALEPH
  • Les moteurs de recherche web scientifiques (Google Scholar, Scirus, Windows Academic Live): explication et qq exemples de moteurs de recherche web libres qui "ciblent" les ressources de niveau universitaire sur le web.
  • Le Chat, messagerie instantanée. Les étudiants l'utilisent et pour répondre à leurs demandes, à défaut d'être parfaitement bilingue bibliothécaire-étudiant, il faut au moins comprendre leur environnement. Don: qu'est-ce que c'est? Comment ça marche? Un mode de communication comme un autre. On teste.
  • Thunderbird: comment utiliser correctement sa messagerie Thunderbird, et en particulier comment utiliser les filtres.
  • Qu'est-ce qu'un services de référence en ligne: principes de fonctionnement; un exemple.
  • OpenOffice – Texte. C'est le traitement de texte installé sur les postes publics de la bibliothèque, il faut pouvoir aider un minimum les usagers qui l'utilisent. Petit tour d'horizon de l'interface. Point particulier: ouvrir un document créé dans Word; enregistrer un document qui pourra être lu dans Word.
  • Amazon. Amazon vend (entre autres) des livres, qu'il propose dans un catalogue en ligne informatisé. Bref: un OPAC. Qu'est-ce qu'il a de plus (et de moins) que le nôtre… sachant que des outils commerciaux arrivent qui proposent aux bibliothèques des interfaces proches d'Amazon.
  • Les Wikis. Un wiki est un site web dans lequel tout le monde peut écrire. Comment ça marche? En quoi cela peut-etre utile, en complément de notre intranet, pour favoriser le travail collaboratif.
  • Le réseau Wifi à la BU: le wifi (réseau internet sans fil) est en cours d'installation dans les BU d'Angers. Quelques explications sur son fonctionnement pour pouvoir répondre aux usagers qui auraient des questions à ce sujet.
  • Les Clés USB. Qu'est-ce que c'est? Comment ça marche en général? Comment ça marche en particulier sur les postes publics de la BU.

7 comments June 12, 2006

links for 2006-06-09


Add comment June 10, 2006

le blog du directeur

Bon, mon chef a un blog: http://tacheau.blogspot.com/
Je ne sais pas si c'est le premier blog de directeur en France. Possible. En tout cas, quand votre directeur (il est vrai plus jeune que vous même) a un blog, vous vous dites… quoi? Que tout fout le camp, sans doute: j'ai horreur de ces gens qui trahissent leur caste. Un directeur c'est censé être en réunion non-stop, pas écrire un blog à la con. Enfin bon, on a le directeur qu'on mérite, j'imagine.


5 comments June 9, 2006

links for 2006-06-07

  • des bibliothécaires créent une bibliothèque dans l’environnement virtuel Second Libre

Add comment June 8, 2006

links for 2006-06-06


Add comment June 7, 2006

Next Posts


Feeds

Recent Comments

nicolas morin on Python, web services, oai
Clio on BPI chat - 6 mois plus t…
Timothee on Python, web services, oai
Clémence on BPI chat - 6 mois plus t…
nicolas morin on BPI chat - 6 mois plus t…

Archives

Links