Tuesday, 28 February 2012

SWIRL 2012 - 2

I forgot two things:

1) the tagcloud of the nominated papers. I simply cut&pasted the text at http://www.cs.rmit.edu.au/swirl12/discussion.php  into Worlde and I got:
(I think it is clear that "evaluation" is a hot issue, once removed obvious terms like "paper", "information", "retrieval", etc., but some might disagree)

2) I believe there was an elephant in the room: Crowdsourcing.


Friday, 24 February 2012

SWIRL 2012

Last week I attended SWIRL 2012: these are my highlights.


SWIRL 2012 has been a workshop where around 50 jetlagged top IR researchers gathered together essentially to experience summer during winter and incidentally to discuss the future of IR research. I am not sure that I count among the top IR researchers. Actually, probably the selection mechanism was more oriented towards the most crazy IR researchers since some really top were missing and some very crazy were definitely there. So I am not sure that I count among the top IR researchers, we can discuss if I count among the top crazy ones, but I'm sure I count among the top jetlagged ones. Luckily enough, all the others were jetlagged as well, and looked like Australians in Europe, so I managed to camouflage myself somehow. Also, and surprisingly, being very jetlagged even helped, since we had long discussions during the nights, and we managed to use the nights to read our emails :) and have the days free for working.

The workshop started with the usual nice dinner in a nice hotel. Well, actually we had a prologue, with some talks at RMIT from some IR researchers. They were, guess, extremely jetlagged, so probably not all the talks were so good, and yes I was one of the speakers. You see what I mean? Anyway, I presented Readersourcing, and I learned two things:
  1. Now I know who was one of the referees of the famous Go*gle/PageRank paper rejected from SIGIR; and that that submitted version wasn't that good... Anyway...
  2. When presenting Readersourcing in these years, I managed to discuss... ehm let's say to argue with S, K, and B. I did not record the first "discussion", but I did for the second one here. Now, the point is: shouldn't I seriously consider to quit this line of research?!?
Anyway, after that, the workshop started with the usual nice dinner in a nice hotel. During it I learned three things:
  1. Evaluation? We haven't had enough.
  2. How to wreck a nice beach (don't ask me to explain this, ask David).
  3. You can live your life as a party (ask Leif)
Then the crowd of 50-top-and-seriously-jetlagged-IR-researchers was packed into a bus and sent to Lorne to experience real summer. Indeed, the first thing we did in Lorne was to go to the nice beach (...). But after that we started to do some serious work. I don't recall all the details, probably because I was considerably jetlagged, but I do remember the main things. We were divided into 6 random groups that had to produce some ideas about the future of IR, i.e., research topics and directions that we felt important for the field. After that, we pooled all the ideas together (you know, we like pooling; actually, it is surprising to me that we didn't manage to stick into this process a logarithm, or a significance test, or the definition of a novel evaluation metric) and we voted the 6 top ideas. Indeed we didn't like the voting result too much so we slightly modified it (I'd say "the Italian way", but strangely there were no Italians driving this process) by merging, splitting, adding, removing, changing, deleting, twinkling, etc., and we obtained The-list-of-the-6-top-ideas-that-will-change-the-IR-world-in-the-future:
  1. Mobile IR
  2. Structured and unstructured information
  3. users People
  4. SmartIR (aka information literacy)
  5. "(less than) zero query" [sic]
  6. and, of course, Argy-Bargy
The other ideas were not killed, and will go back into play later on. We were then asked to form six groups, each one aiming at discussing one of the six ideas. Looking at the list it was very difficult for me to choose which group to join. Obviously, any schoolboy will understand the foundational and metaphysics nature of Argy-Bargy. Anyone will agree that we shall have no other information besides structured and unstructured. We can't kill users People, of course (fair enough, we didn't write "students"). SmartIR is the smarter term in the list. I've been working for the last 10 years, and published most of my last papers, on "(less than) zero query" [sic], although with different, and equally stupid strange labels like "query-free IR", "zero-interaction interactive IR", "browsing the virtual space by walking in the physical space", etc.

But at the end I joined the Mobile IR group. And, guess it, it was not about Mobile IR. It was about Understanding what Mobile IR is. Funny: a group that did not understand what it was about but aimed at understanding what its (mistaken) topic was about. How couldn't we succeed? Plus, when people chose their own group, strange things happened. Some people were not able to find their group; perhaps it was on the nice beach? Some people (those above plus others) joined another "wrong" group, and some of them, just to avoid being idle, decided to act as trolls. We had two trolls in the Mobile IR group, and you will understand how that made the discussion far more interesting, lively, polite, and constructive than you could ever imagine. Luckily, the night came, and after a good sleep (or perhaps some good chats, beers, barbecues, etc., since we were seriously jetlagged and can't manage to have that much sleep anyway), the morning after, Jamie and Vanessa had a clear vision of what the group was about and started drafting the report (each group was meant to write a report). Not having trolls around early morning probably helped. Did trolls suffer from jetlag? Did trolls take surfer lessons? We will never know.

As mentioned above, the other not-top-6-best-great-ideas were not killed, and some still-quite-heavily-jetlagged-IR-researchers volunteered to write a short report on those. Now, I have to mention the best name of the workshop: Axiometrics (credits to Arjen), a research line aimed at defining axioms in order to understand the about 100 IR effectiveness metrics. BTW, we might think of Anatometrics as well.


So the workshop was great, the organizers incredibly managed to obtain something out of about-50-top-crazy-IR-researchers-that-as-you-know-were-very-jetlagged, the discussions were interesting, I managed to have some good ideas and contacts for future paper writing, and perhaps some contact for my sabbatical as well (I'm looking for places were to stay during my sabbatical; please let me know if you're interested. I promise that I won't be so jetlagged for the whole sabbatical duration.) Plus, I've been out of business recently, for several reasons including lack of funds, A.'s birth, etc., and it was really nice to meet some old good friends and some new ones.

Criticisms? I always have. We could have made use of some "Social Web/Web2.0" tools, like Gdocs, Facebook, Twitter, to have a virtual discussion as well and, for example, to vote the ideas (did I hint that the voting mechanism was a bit... "italianized"? Now, we all know about Arrow's theorem, but that was far beyond that). Someone said that s/he had the impression that we were simply drafting a report to make easier for US and Australian researchers to get funds. Someone had the impression that the meeting was a bit too "old fashioned". But as I wrote, the organizers did manage to get something out of about-50-top-IR-researchers-that-as-you-know-were-very-jetlagged, and this is an enormous success.


Some interesting sentences were uttered during those days, and shall never be forgotten:
  • Cloud computing is not transparent.
  • You can't leave indoor outdoor, but you can't leave outdoor outdoor either.
  • How to wreck a nice beach.
  • Life as a party.
  • (Julio please help with the other one)
  • (anybody welcome to add)
Post workshop!!

Once back in Melbourne, a (randomly) selected subgroup of all those (somehow) 50 selected IR researcher had an interesting post-workshop, post-dinner, during-beer mini-workshop on p*orn and user models. I took some pictures of the participants:

As you can see, we range from someone (pretending to be?) not interested, or perhaps simply jetlagged, to someone really having fun, to a shy guy who doesn't want to be recognized, to someone counting beers (not an easy task!), to someone hiding in the shade. I learned some interesting statistics about user features. Anyway, guys, it was fun. Thanks!


Wednesday, 8 February 2012

Ma dico io...

Qualche giorno fa ho pagato online un bollettino postale su poste.it. Alla fine del pagamento, mi è apparsa una pagina in cui c'era scritto che mi sarebbe arrivata nella "Nuova bacheca" personale una ricevuta del bollettino pagato (ovviamente la soluzione giusta sarebbe di visualizzare la ricevuta nella pagina web *e* di spedirmi un messaggio email, e questa seconda cosa veniva fatta prima che venisse introdotta 'sta "Nuova bacheca").

Vabbè. Comunque guardo e nella bacheca non c'è nulla. Allora scrivo non mi ricordo più neanche come, dove e cosa, una richiesta per spiegare il problema. Ieri (dopo una settimana!!) mi arriva questo email:
Gentile cliente,

in riferimento alla sua richiesta relativa all'uso dei servizi on-line del sito www.poste.it. del giorno 01/02/2012", le indichiamo alcuni controlli che può eseguire sul suo computer:
1. verificare che il browser consenta connessioni con protocollo SSL e accetti i cookie della sessione
2. eseguire periodicamente la pulizia dei file temporanei e dei cookie
3. verificare le proprietà data/ora e fuso orario del computer
4. verificare il corretto inserimento del nome utente e della password. Il nome utente va inserito nel formato nome.cognome più l'eventuale estensione (ad esempio mario.rossi-1234) richiesta al momento della registrazione. La password va digitata rispettando la sequenza dei caratteri maiuscolo o minuscolo cos come inseriti in fase di registrazione o in occasione dell'ultimo cambio.
Qualora avesse difficoltà nell'eseguire tali controlli o comunque risultasse ancora necessaria la nostra assistenza può ricontattarci telefonando al numero 803.160, gratuito da telefono fisso, (dal lunedì al sabato, con orario 8:00 20:00) effettuando la scelta 3 per i Servizi Internet.

Distinti saluti
Poste Italiane

Ma dico io... sono messaggi da mandare? Dopo una settimana?! Non riportano la mia richiesta, il messaggio è chiaramente preconfezionato e one-size-fits-all, e mi chiedono pure di telefonare? Mah. Per scrupolo controllo 'sta bacheca e ci sono ben 2 copie della ricevuta...E comunque una copia della ricevuta c'era anche in non so più quale meandro del sito web (l'avevo trovata quasi per caso visto che non rispondevano alla mia richiesta).

Bah. Che servizio.

Wednesday, 1 February 2012


Qualche Consiglio di Facoltà fa si è discusso dei laboratori di facoltà. Qualcuno (me compreso) sosteneva che forse prima di spendere migliaia di euro in postazioni di lavoro poteva aver senso pensare di "sfruttare" i portatili degli studenti e investire i miseri fondi in altro (software, server, infrastrutture, ecc.).

Più o meno contestualmente, qualche Consiglio di Facoltà fa (qualche mese fa!) ho chiesto che venisse creata una mailing list di facoltà. Ancora niente... (è un'operazione di pochi minuti). Volevo usare la mailing list anche per divulgare i risultati di un questionario; siccome la mailing list non c'è, divulgo qui.

Il questionario riguardava proprio la situazione laboratori di facoltà e conteneva varie domande, alcune con risposte aperte in testo libero. Hanno risposto in 406 (su circa un migliaio di studenti della facoltà). Fra i risultati, solo il 6% non ha a disposizione un suo portatile; solo il 17% preferisce avere a disposizione una postazione fissa in laboratorio. Fra i commenti in testo libero, ci sono anche un po' di richieste "interessanti" e ricorrenti, tipo avere stampanti migliori, avere accesso a internet e alla rete Wi-Fi, ecc.

Insomma, in una facoltà con corsi di laurea vari in Informatica, IT, ICT, la situazione è:
  • non c'è una mailing list dei membri della facoltà;
  • dai laboratori non c'è l'accesso alla rete WiFi;
  • si fa fatica a stampare.
Ecco: bah.

P.S. Riporto qui anche la mail che avevo fatto inviare il 5 ottobre 2011 a tutti i membri del CdF, così, per completezza (tanto, in barba alla netichetta, è già arrivata ad altre persone oltre i destinatari originali...):
Oggetto: Sui laboratori di facolta'

Care/i tutte/i,

durante l'ultimo CdF, [...] ha sollecitato una riflessione ponderata sul modo migliore per investire il contributo per i laboratori di facolta' che l'Ateneo (forse) ci assegnera'. Vorrei portare alcuni contributi piu' meditati di quanto ho gia' detto in Facolta', e soprattutto alcuni dati. Cerco di essere sintetico.

Innanzi tutto, osservo che questo non e' un problema solo nostro, e che se ne parla ormai da anni, come una veloce ricerca su google consente di appurare:

- http://www.google.com/search?q=what+computer+lab+should+university+have+now+that+students+have+laptops%3F

Poi, ecco alcuni dati:

1) Ho svolto un veloce sondaggio al corso di Programmazione e laboratorio per la laurea in TWM. Erano presenti circa 70 studenti, la maggior parte matricole piu' alcuni studenti degli anni successivi. Risultato: il 100% (*tutti*) avra' un portatile entro 6 mesi.

2) Ho svolto un sondaggio piu' sistematico usando Google Form. Il sondaggio dovrebbe essere stato inviato agli indirizzi mail SPES di tutti gli studenti di un corso di laurea della nostra facolta' (incluso l'interfacolta' CMTI). Risultati:

- hanno finora risposto 304 studenti (su un totale di circa 1000, immagino), in due giorni e mezzo;
- il 95% ha un proprio portatile o ce l'avra' entro 6 mesi;
- il 50% dichiara di preferire di "Poter usare il tuo portatile"; il 25% si dichiara "Indifferente"; il 16% di preferire di "Avere a disposizione un calcolatore fisso da usare, fornito dalla Facoltà".

Il sondaggio e' ancora in compilazione, immagino soprattutto da parte di studenti del primo anno che forse non hanno ancora un indirizzo email su SPES. Fra qualche giorno chiudero' il sondaggio e rendero' disponibili tutti i dati; comunque il quadro mi pare gia' chiaro.

Sulla base di questi dati, mi pare che non si possa che ribadire la necessita' di ridiscutere le modalita' di allocazione degli eventuali fondi per il laboratorio. Mi sembra che sia da considerare seriamente l'opzione di *non* investire in 50 postazioni di lavoro ma in infrastrutture di rete, prese elettriche, stampanti, software, licenze, servizi Web, ecc., come appunto suggerito durante il CdF. Molti commenti degli studenti (raccolti con altre domande specifiche del questionario) vanno in questo senso.

Secondo me sarebbe anche una buona mossa investire in un certo numero di laptop (5? 10?) da fornire in comodato d'uso ai migliori studenti di ogni corso di laurea, magari in convenzione con qualche venditore per avere prezzi scontati e una buona pubblicita'.

Gia' che ci sono, aggiungo in chiusura anche due brevi riflessioni sul sistema informativo di ateneo/facolta'.

A livello di ateneo, non c'e' una mailing list degli studenti di un certo anno/corso/facolta'. Per inviare il questionario a tutti gli studenti ho dovuto interagire con l'URP che, "a mano" (non so i dettagli...) ha dovuto estrarre da un database i vari sottoinsiemi di studenti e procedere a piu' invii separati (per inciso, questo e' il motivo per cui ho usato poc'anzi condizionale sull'invio a tutti gli studenti della facolta'). Ho interagito per un'ora con Google Forms per preparare il sondaggio, e poi ho interagito per un giorno con l'URP per riuscire a inviarlo. Scusate se sono brutale, ma mi sembra una cosa ridicola.

Ma ancora piu' ridicolo mi sembra il fatto che non c'e' una mailing list dei docenti del nostro CdF (di Scienze!), ne' del CCL (in discipline *informatiche*!). Per il CCL c'e' un elenco di docenti "in chiaro", e per il CdF neanche quello. Le liste CdF/CCL consentirebbero di far circolare certi dati per email (tipo questo messaggio, ma anche, ad es., i dati sulle immatricolazioni/iscrizioni), con conseguente risparmio di tempo e maggiore trasparenza. Usando gli strumenti di Google si fa tutto in un'ora; e c'e' comunque anche un servizio di ateneo.

Quindi concludo chiedendo che vengano create al piu' presto le mailing list di CdF e CCL, con gestione in carico alla segreteria di facolta'. Se questo non verra' fatto entro il prossimo consiglio, e' mia intenzione chiedere una votazione durante le Varie ed eventuali per deliberare sulla creazione immediata delle liste.
