lundi 13 octobre 2008

"Today is the first day of the rest of your PhD ..."


Bon comme d’habitude, ça fait longtemps, tout ça, tout ça. Depuis la dernière fois, j’ai sillonné la Croatie du nord en sud, histoire de voir un peu le soleil au milieu de l’été anglais le plus pourri de mémoire d’historien-météorologiste, ainsi que de constater que la Croatie, pour le tourisme à l’aventure, ben c’est trop tard.


Deux semaines après l’avoir quittée, j’étais de retour dans ma bonne ville d'Oxford, dans une nouvelle maison, et dans un nouveau labo, labo dont finalement je ne parlerai pas puisque j’ai terminé ce stage et suis retourné dans le labo où j’étais il y a deux billets. Donc voilà, depuis une semaine, je suis officiellement élève-doctorant en ingénierie biomédicale, option recherche. Alors pour l’instant c’est beaucoup d’administratif et d’organisationnel, et je n’ai pas franchement eu le temps de rechercher (je ne parle même pas de trouver !), mais il semblerait que j’ai un bureau pour les trois ans qui viennent. Me reste plus qu’à écrire un document original de 300 pages sans perdre la bou(sso)le, et tout ira bien.


Oh well.

samedi 19 juillet 2008

My Erdös Number is 5!


Malgré le fait de ne pas être un mathématicien et celui de n'avoir publié qu'un article vaguement scientifique (avec un seul coauteur), mon nombre d'Erdös est de 5 (d'après ce site, sur lequel je ne figure pas, mais mon coauteur si). J'en suis moi-même surpris : la moyenne de la base de données de l'American Mathematical Society (que des gens bien plus sérieux que moi) est de 4.65 et la médiane exactement 5, et depuis la mort de Paulo-la-science, le minimum atteignable par un nouveau venu est 2! Prochaine étape : obtenir un nombre de Bacon (comme Kevin, pas comme Francis) afin de rentrer dans le cercle très très fermé des gens qui, comme elle, ont un nombre d'Erdös-Bacon fini !

Small world.


jeudi 17 juillet 2008

Smoke and consideration


Jeudi dernier aux alentours de onze heures du matin. J’avais passé la majeure partie de la nuit à écrire, m’était finalement endormi aux alentours de l’aurore, donc naturellement, je dormais. À un pied et demi de mon oreille : Pop …. Pfffffffffshhhhhhhhuiiiiiiiit. Hein ! Qu’est ce que c’est que ce bruit ? Et là, dans un demi sommeil, l’horreur : une fumée blanche et odorante s’échappe du chargeur de mon portable. Alors je ne sais pas si vous êtes comme moi, mais mon portable, c’est à peu près mon meilleur ami, ou tous mes amis à la fois, mon lien privilégié vers l’extérieur, le vecteur de mes alter egos numériques, ma principale source d’information (ou désinformation), ma principale source de distraction, le garant de mon existence virtuelle en dehors de cette ville, et pour ainsi dire, le garant de mon existence pour quiconque n’habite pas dans cette ville, voire pour ceux qui y habitent. Je vendrai un rein et la moitié de mon foie avant de vivre sans portable. Über-drame, donc über-panique. Chargeur visiblement mort. Portable … okay sur batterie. Soulagement. Au dixième réveillé, je me rappelle que c’est le jour de l’electric testing dans le bâtiment. Et effectivement, le frigo est muet comme une carpe, aucune lampe ne marche. Mais enfin, ça m’a quand même grillé un chargeur cette coupure de courant. M’étant rendu compte que ça n’était pas arrivé qu’à moi, je reporte l’incident à la présidente de ma Middle Common Room, qui transmet aux autorités compétentes du College. Et quatre jours ouvrables et deux coups de fils plus tard, je récupère à la loge un exemplaire tout neuf du modèle exact, avec les compliments du College, malgré le refus catégorique du sous-traitant d’admettre que deux portables et un ordinateur grillés au moment exact où il coupe le courant peuvent éventuellement être une conséquence de ladite coupure. J’ai transmis mon appréciation à la Middle Common Room et au personnel du College concerné. Une efficacité pareille, sans un soupçon de malhonnêteté, pour un truc que bien des organisations auraient laissé mourir, j’ai trouvé ça admirable. Il y a des jours où je ne suis pas mécontent d’être ici.

mardi 15 juillet 2008

What do I do again?

Alors j’en étais à essayer d'expliquer ce que je fais concrètement. Après trois semaines passées dans les articles scientifiques à tapoter du LaTeX pour un rapport de 50 pages à rendre dans dix jours, je devrais être en mesure de vous faire le pitch.

Mettons nous en situation : un jour où tu aurais mieux fait de ne pas te lever, tu te retrouves à l’hôpital. Pas en soins intensifs non plus, juste le niveau en-dessous, on garde un œil sur toi, mais tu as juste besoin de repos et d’un peu de potion magique en intraveineuse, un peu comme un coureur cycliste en fin de Tour. Normalement tout va bien. Sauf que voilà, il y a cette statistique qui ennuie un peu les systèmes hospitaliers depuis dix ans, qui raconte que 25 000 patients décèdent des suites d’un accident cardiaque survenu à l’hôpital par an au Royaume-Uni, et pas loin de 100 000 aux Etats-Unis (je ne connais pas le chiffre pour la France, mais je suspecte un ordre de grandeur comparable). Ça fait un peu tache sur le bilan de fin d’année, surtout si on sait que dans une grande majorité des cas l’accident peut être évité, à condition d’avoir identifié les signes avant-coureurs : anomalie des signes vitaux que sont le rythme cardiaque, le rythme respiratoire, la tension, la température et la saturation de l’oxygène dans le sang (‘O2 sat’ dans Urgences). Alors là tu te dis, mais à la télé, et maintenant même à l’hôpital à côté de chez moi, les patients ont une pince au bout du doigt reliée à un moniteur qui fait bip-bip quand leur cœur s’arrête. C’est vrai, et normalement le rôle du moniteur est de donner l’alarme si les dits signes vitaux se mettent à dériver. Le problème, c’est que les seuils d’alarmes (un maximum, un minimum) sont en général donnés pour chaque signe vital, ce qui du point de vue du traitement du signal est une farce grotesque qui oblige à restreindre considérablement la plage de valeurs acceptables pour chaque signe afin de ne pas rater les alertes importantes, mais qui a pour résultat d’engendrer un nombre considérable de fausses alertes, du genre "Monsieur, ça va, on vient d'avoir une alerte pour tachycardie", "Quoi, ah non, tout va bien, je regarde Derrick". Du coup, le personnel infirmier qui ne peut pas faire confiance au système n’a d’autre choix que celui d’ignorer toutes les alertes et font des rondes toutes les deux, trois ou quatre heures suivant l’état du patient. (Lecteur, prends ton souffle ça va devenir technique). Et là, l’ingénieur qui sommeille en chacun de nous se dit, premièrement, comment tu veux reconstruire correctement l’état d’un patient si tu échantillonnes toutes les deux heures alors que la dynamique du système (on parle toujours du patient là) est de l’ordre de la minute, Shannon doit se retourner dans sa tombe, et deuxièmement, c’est quand même ballot, on a la technologie pour acquérir les signes vitaux en permanence, et on en fait pas grand-chose d’utile, il y a un créneau pour de l’apprentissage artificiel. Et bien c’est exactement ce que s’est dit Supervisor il y a quelques années et il a même développé un système, qui est devenu une compagnie, pour se garer dans le créneau.

En gros, tu acquiers des données sur des patients bienveillants dans des hôpitaux à travers le monde, et ça te donne tout plein de vecteurs de signes vitaux. Tu utilises la formule magique ‘ils sont tous indépendants et identiquement distribués’ (hypothèse royalement fausse, mais il semblerait qu’on ne peut rien faire sans) selon une distribution en n dimensions (n = 4, 5 ou ‘plein’) que, comme tu en as tout plein des vecteurs, tu peux estimer. Un coup de K-means, un coup d’estimateurs de densité de noyaux (fenêtres de Parzen), tu rognes sur les bords pour ne garder que les données les plus 'normales', et tu dis, "bon voilà, donnez moi un vecteur de signes vitaux, et je vous dirai avec quelle probabilité le patient est en bon état". Pour éviter de recevoir un milliard d’emails par seconde, tu mets ça dans une tablette que tu installes dans les chambres des hôpitaux, juste à côté du moniteur qui du coup voit son utilité décupler. Et pour faire simple tu décides d’un seuil sur la valeur de la probabilité pour déclencher des alarmes. Et comme il est dans l’espace de probabilité et qu’il prend en compte tous les signes vitaux disponibles simultanément, ton système ne fait presque plus de fausses alertes, et repère toujours les bonnes alertes (sensibilité maximale, spécificité améliorée). Après tu te dis, okay, ça marche, mais mon hypothèse du début elle est royalement fausse, qu’est ce que je peux faire pour améliorer ça, et aussi, mon seuil, je l’ai un peu décidé au jugé, ce serait bien si je pouvais mettre un peu de théorie derrière. Et tu embauches Sam, et tu lui donnes huit semaines pour faire ça. (Lecteur, prends ton souffle ça va devenir super technique). Tu lui dis d’invoquer la théorie des valeurs extrêmes, qui modèle la queue des distributions de probabilité, et qui est aux extrema des distributions de probabilité ce que le théorème central limite est aux sommes de variables aléatoires, via le théorème de Fisher-Tippett. Et comme on a besoin d’une théorie multivariée, et que les valeurs extrêmes, ça n’existe pratiquement que pour le cas univarié, et que ça n’a été utilisé sur des séries temporelles de données biomédicales une seule fois de mémoire de Google, tu le fais travailler avec un post-doc qui s’intéresse exactement à ça, mais dont la thèse n’est pas encore publiée. Donc voilà, je suis presque prêt à rendre mon rapport, et même si je sature un peu, ça m’a diablement intéressé. La théorie est belle et légèrement sous-développée, l’apprentissage artificiel me plait, la cause est juste. Que demander de plus (pour un sujet de thèse, j’entends) ?


PS: Je n'ai pas vendu de secret industriel, il y a un brevet sur tout ça, gniark gniark.

mercredi 2 juillet 2008

What do I do?

La situation dans laquelle on me demande ce que je fais se pose de plus en plus souvent, que je fasse une nouvelle rencontre ou que je rentre en France et voit des gens que je ne vois que trop rarement. Et systématiquement, les deux mêmes choses me viennent en tête : "Pff, j’en ai marre de raconter cette histoire" et "Comment rendre ma réponse à la fois courte, claire et un tantinet intéressante ?"

Parce qu’en plus d’être dans un autre pays, la forme de mon programme n’est même pas encore traditionnelle ici, ce qui complique un peu le tableau. Je vais donc essayer de raconter, en français dans le texte, mon quotidien académique. À défaut de réussir brièveté, clarté et fascination dans un même billet, si je parviens à donner une vague idée à quelqu’un qui me posera la question de manière informée lors de mon prochain passage en France, ce sera déjà ça de pris.

Donc, je suis officiellement en thèse, dans un programme qui dure quatre ans, divisé en deux grandes parties : une composante enseignée d’environ un an (biologie, biophysique, bioinformatique pour la partie bio. Imagerie médicale, modélisation mathématique et programmation pour la partie intéressante) et une composante recherche environ trois fois plus longue. L’idée de la première année est en principe d’amener des étudiants avec un premier diplôme en X (insérer le nom d’une matière scientifique sans rapport avec la biologie) vers des applications mélangeant X et les sciences du vivant, et donc de leur fournir un cours de biologie pour les nuls ++ en version accélérée. Au passage, j’en profite pour clamer tout haut que la biologie, je détestais ça au lycée, et ça n’a pas changé ! Mais ça n’est pas grave dans la mesure où je peux faire un tas de trucs qui n’incluent pas de remplir des béchers de microbes à la pipette en portant des lunettes ridicules huit heures par jour.

Avec tout ça, je suis toujours doctorant sans avoir de sujet de thèse ce qui me vaut des froncements de sourcil à l’occasion. Mais c’est normal ! Parce qu’en plus de neuf mois de cours intensifs, j’ai le droit d’aller faire un galop d’essai dans deux laboratoires de l’université, histoire de prendre la température et voir si je suis prêt à m’y engager pour trois ans. Deux fois deux mois de juin à début octobre. Et là je suis pile au milieu du premier, et en plein début de l’écriture du rapport, ce qui fait que j’ai enfin une vague idée de ce que je fais depuis un mois. Je vous raconte ça dès que je peux.