links for 2006-06-12
-
Abusing Amazon images
Add comment June 13, 2006
Je l'ai dit en janvier, je crois, j'ai commencé à apprendre (seul avec mes petites main) la programmation en Python (pendant mon temps libre, ça va sans le dire).
J'ai laissé tombé pendant un long moment puis repris il y a environ un mois.
Comme il m'a toujours semblé plus facile d'apprendre quelque chose en pratiquant, j'ai un projet, que j'ai baptisé "AlephSuggest". Pas besoin d'être grand clerc pour deviner ce que j'envisage: récupérer mon catalogue en XML, en extraire les mots sujets, par ex., les écrire dans un fichier XML qui servira de base à un objet XMLHttpRequest pour faire AlephSuggest.
Un peu ambitieux pour un newbie, sans doute. On verra bien.
Ce que j'ai réussi à faire ce week-end (après env. 1 mois d'information générale sur Python -grâce aux excellents Dive into Python et How to Think like a Computer Scientist, Learning with Python et après 1 week-end de bricolage): extraire le texte des 610 d'une notice en XML.
Ma notice ressemble à ça:
<?xml version = "1.0" encoding = "UTF-8"?>
<record>
<record_header>
<set_entry>000000001</set_entry>
</record_header>
<doc_number>379711</doc_number>
<metadata>
<oai_marc>
<fixfield id="FMT">BK</fixfield>
<fixfield id="LDR">—–cam1-2200469-i-450-</fixfield>
<fixfield id="001">2006140431</fixfield>
<fixfield id="005">20060421110028.0</fixfield> <varfield id="010" i1=" " i2=" "> <subfield label="a">2-7314-0516-3</subfield>
<subfield label="b">Br.</subfield>
<subfield label="d">22.00 EUR</subfield>
</varfield>[...]
<varfield id="610" i1="0" i2=" ">
<subfield label="a">droit des societes</subfield>
<subfield label="a">droit civil</subfield>
<subfield label="a">contentieux</subfield>
<subfield label="a">juridiction civile</subfield>
<subfield label="a">procedure civile</subfield>
</varfield>[...]
</oai_marc>
</metadata>
</record>
Le but du jeu est de sortir de tout ça les textes des sous-champs du champs 610. En Python je fais ça:
>>> import sys
>>> from elementtree import ElementTree
>>> tree = ElementTree.parse("notice.xml"
>>> for node in tree.findall(".//varfield"): # gets the varfield tagsif node.get("id"
== "610": # only gets varfield with 610, subject in Unimarc
print node.get("id"
#prints the id just to make sure verything's all right
if node.getchildren(): # gets the subfields of varfield 610
for child in node: # loop: for each subfield..
print child.text # prints the text
Le résultat:
610
droit des societes
droit civil
contentieux
juridiction civile
procedure civile
Ces 9 lignes m'ont pris environ 8h de travail: j'ai eu une percée dimanche en buvant un whisky-coca et en me disant qu'il fallait utiliser ElementTree… C'est un début…
La suite:
S'il y a des gens qui connaissent Python dans les parages… Toute aide est bienvenue
Add comment June 12, 2006
Avec un collègue on a mis au point, pour le premier trimestre de l'année universitaire prochaine, un cycle de formations du personnel.
Les séances durent environ 1h.
Le but est de sensibiliser le personnel à l'évolution des outils et des usages informatiques. Ce n'est pas forcément directement documentaire mais cela a toujours un impact sur la vie de la bibliothèque. Directement, par exemple avec OpenOffice, qui est sur les postes publics à la BU. Indirectement, parce que c'est l'environnement web dans lequel le public a l'habitude, maintenant, d'évoluer: par ex. Amazon.
Il y a une exception dans cette liste, c'est Thunderbird: c'est maintenant la messagerie par défaut et c'est donc une formation à l'outil de travail.
Bref, il s'agit dans tous les cas d'être mieux à même de renseigner le public.
Le programme des formations prévues:
7 comments June 12, 2006
Add comment June 10, 2006
Bon, mon chef a un blog: http://tacheau.blogspot.com/
Je ne sais pas si c'est le premier blog de directeur en France. Possible. En tout cas, quand votre directeur (il est vrai plus jeune que vous même) a un blog, vous vous dites… quoi? Que tout fout le camp, sans doute: j'ai horreur de ces gens qui trahissent leur caste. Un directeur c'est censé être en réunion non-stop, pas écrire un blog à la con. Enfin bon, on a le directeur qu'on mérite, j'imagine.
5 comments June 9, 2006
Add comment June 8, 2006
Add comment June 7, 2006
La BU d'Angers signale env. 6800 périodiques électroniques dans son offre, dont 2300 correspondent à des titres en Open Access (DOAJ) et 4300 correspondent à des abonnements pris par la BU. Presque toute notre offre concerne les domaines Science et Santé. Nous avons fait dans les dernières années des tentatives dans les domaines du droit, de l'éco, etc. Sans succès. Presque toute notre offre de périodiques électroniques (c'est différent pour les bases de données) est, par ailleurs, concentrée sur le niveau Recherche. C'est là aussi, de toute façon, qu'est l'usage (statistique).
Bref: un moteur de recherche fédérée sur l'ensemble de nos périodiques électroniques viserait essentiellement les périodiques de niveau recherche dans les sections scientifiques et médicaux.
Scopus est notre base de données bibliographiques principale. 82% des titres pour lesquels nous achetons un accès en ligne y sont dépouillés: env. 3600 titres; 18 % des titres d'Angers (750 titres) ne sont pas dépouillés dans Scopus.
Je ne suis pas entièrement convaincu que l'achat d'un moteur de recherche fédérée se justifie pour couvrir les 750 titres que ne couvre pas Scopus. Du point de vue de la documentation recherche, Scopus est notre moteur de recherche fédérée.
1 comment May 29, 2006
Une fois n'est pas coutume, je vais sortir du cadre de ce blog (la BU d'Angers), pour signaler que le blog de Jean-Charles devient pro: nom de domaine propre http://www.houpier.fr/, hébergement payant et (donc) performant. Mais une constante: les feuilles de style toujours un peu, comment dire, décalées…
Ceci étant le message sur lequel je tombe sur son blog me permet de retomber sur mes pattes: la BU d'Angers. En l'occurence, le PEB. Dans son post, il parle de la mise en place de formulaires de peb qui partent des bases de données (ici: PubMed et Scopus) pour alimenter directement des formulaires de demandes en ligne. Mais n'est-ce pas ce que font les résolveurs de lien OpenURL?
Add comment May 24, 2006
Add comment May 24, 2006
| nicolas morin on Python, web services, oai | |
| Clio on BPI chat - 6 mois plus t… | |
| Timothee on Python, web services, oai | |
| Clémence on BPI chat - 6 mois plus t… | |
| nicolas morin on BPI chat - 6 mois plus t… |