25 janvier, 2017

CERN #16 Week 16-20 January

Invenio – Jean-Yves Le Meur

Tuesday 17th, I had the opportunity to meet Jean-Yves Le Meur, who used to work on the Invenio software. Invenio is a digital library software solution, created at CERN to host and organise their millions of documents. It has now several instances, visible here.

Below, some of my notes in French:

Dès 1994 ont fait serveur de doc. Décision de lancer serveur au lancement du web. Photo lab, video lab, AFS : système distribué de fichiers qui arrive à la fin de sa vie. Ordinateur client, serveur ailleurs. Si quelqu’un part du CERN sans stocker ses données sur CDS, ses données sont perdues.

Invenio a mis 10 ans à sortir pour le public. Tind spin-off de Invenio, la seule du CERN dans le domaine informatique. Par contre il y en a beaucoup dans le domaine médical.

Indico est aussi utilisé à l’extérieur mais pas de contrat officiel. Beaucoup plus de littérature grise en physique que dans d’autres domaines. Les universités paient les maisons d’édition pour pouvoir publier en open access. Le Cern attribue numéros DOI (Document Objet Identifier) pour les citations. D’autres systèmes de numéros uniques existent.

Tous les flux sont pris en charge sur Invenio. Brouillons, commentaires, etc.  Edms : Engineering Document Management Service Parfois pics d’accès par le grand public, 10’000 recherches par jour environ. Les videos e-learning sont dans CDS. Les thèses sont validées par la bibliothèque avant d’être ouvertes au public.  

Aussi travail de digitalisation des bandes magnétiques. Egalement photos d’archives. Scans de 220’000 vieilles photos. Ces photos manquent de légendes, ils faudrait savoir qui est sur les photos, retrouver les lieux, les expériences, etc. En 2015, l’interface des photos en ligne a ouvert un espace commentaire pour inciter le crowdsourcing. Le problème est que les gens n’ont pas réagi, du coup ils cherchent un autre moyen de légender ces photos.

Maintenant, Jean-Yves Le Meur travaille sur mémoire digitale, norme ISO d’un nouveau logiciel construit d’après Archivematica, un logiciel en open source. Cette norme garantit une préservation long terme. 

Potentielles futures solutions d’archivage : expériences sur ADN synthétique, dans un laboratoire en Allemagne. Il y avait aussi eu le projet de mettre sous la montagne toutes les graines qui existent pour avoir une mémoire de la biodiversité d’une époque.

ALICE’s Event Displays – Jeremi Niedziela

Apart from his thesis, Jeremi works on the ALICE’s event displays. He takes care of the software that generates the 3D visualisations. I wanted to meet him to understand what pieces of information are visible, chosen, and useful for the physicists and how the visuals choices have been made.

He told me that once a picture is released to the public, when there is a news about ALICE for example, it is spread in newspapers, which like this kind of visuals.

You can see the events live on this website. The moment I write these lines ALICE is paused. It will play again in May 2017.

Jeremi also participated to the project “More than ALICE”, a reality-augmented 3D paper model. The ALICE’s event are displaying live on the paper model.

I know Vuforia because we have worked with this Unity plugin for our project “City Cells”, with Transmïi and Aprobado studio 🙂

YES! I KNEW it! I may have recognized ALICE’s logo font, what do you think?

Below, you’ll find my notes in French:

Dans ALICE, tout est dans un cylindre de gaz, et non dans des couches de détecteurs comme les autres expériences. Ce ne sont pas des traces qui sont laissées par les particules mais une série de points, qui ont comme donnée, entre autres, leur énergie. Au centre, plusieurs couches de semi-conducteurs pour avoir plus de précisions puisqu’il y a plus de concentration de points.

Puis chambre a gaz pleine de points. Et autour, le cylindre “time of flight”, qui compte combien de temps la particule a mis pour y arriver depuis le centre. En mesurant la courbure des traces on peut définir leur élan et le temps qu’elles mettent à arriver jusqu’à ce cylindre. En mesurant aussi la vélocité et l’élan on connait la masse. Cela nous permet de savoir de quelle particule il s’agit.

Cela arrive que des particules se désintègrent en deux particules sœurs. Ce sont les algorithmes qui vont faire la reconstructions des lignes entre tous ces points. Il y a, parfois, des points qu’on ne sait pas relier a qqch.

Toujours un détecteur special pour les muons qui sont les seules particules à ne pas s’arrêter aux parois des autres détecteurs.

Les particules déposent de l’énergie a la fin, donc sur la visualisation, sont dessinées des sortes de tours rectangulaires à la fin de leur trajectoire, qui définissent la quantité d’énergie.

Quel format de datas? Il faut un convertisseur parce que c’est dans un format interne. Ensuite, json and xml.

Il y a des “familles”, des silhouettes reconnaissables de collisions. L’idée générale de ces visualisations date d’il y a 10 ans. Ce qui a changé c’est à quoi ça ressemble. Les couleurs sont les types de particules (des familles, encore une fois, car il y aurait beaucoup trop de particules différentes pour pouvoir faire la distinction avec 1000 couleurs). L’idée est aussi de donner un outil aux scientifiques pour customiser leur représentations.