Preghierina

Visto quanto accaduto con precedenti inserimenti di massa, vorrei gentilmente chiedere a chi se ne occuperà di trovare il modo di non creare articoli orfani: non tutti i registi/attori/sceneggiatori/etc hanno un articolo, non tutti quelli che ce l'hanno hanno una filmografia (o una aggiornata), quindi non fate affidamento su questo. Se possibile, nascosta dove volete, una sottopagina contenente tutti i link a tutti i film potrebbe salvaguardare quella pagina di servizio. Grazie :-) --Sn.txt 19:13, ott 8, 2005 (CEST)

Giusta osservazione. Si potrebbe aggiornare automaticamente la pagina elenco di film. --Guam->@ 17:03, ott 9, 2005 (CEST)

IMDb

Qualcuno potrebbe chiedersi se si possono usare i dati dell'Internet Movie Database che dovrebbe essere quello più completo esistente sul globo terracqueo. Questo perché il tutto era nato come un progetto aperto. In effetti, i dati si possono scaricare ma il loro riutilizzo è ristretto:

The data can only be used for personal and non-commercial use and must not be altered/republished/resold/repurposed to create any kind of online/offline database of movie information (except for individual personal use). Please refer to the copyright/license information enclosed in each file for further instructions and limitations on allowed usage.

Ciò che non toglie che IMHO si potrebbe prevedere nelle schede anche un campo imdbcode che possa creare dei link automatici, ovvero che serva per disambiguare dei titoli.

La lista dei film disponibile a [1] è grande circa 5 Mega (pensavo di più).

--Abragad 20:42, ott 8, 2005 (CEST)

In fondo io uso i dati dell'IMDb ogni volta che creo una scheda film... basta prelevare solamente i dati utili i fini della tabella, che sono reperibili in rete e quindi non hanno problemi di copyright e cose simili, no? shaka 12:39, ott 9, 2005 (CEST)
I database sono molto interessanti, ci sono anche i titoli in italiano. Il problema è la legittimità d'uso. Ma se si prendono solamente i dati oggettivi, quali durata, regista ecc. evitando la trama e altri commenti, chi può dire che i dati sono stati usati impropriamente, in fondo si tratat di dati tali e quali, non potrebbero essere diversi da così. --Guam->@ 17:00, ott 9, 2005 (CEST)

Concordo con Guam. Nessuno può contestare l'uso di un dato oggettivo. Da evitare invece tutto ciò che è frutto della creatività dei redattori della fonte di partenza. --Paginazero - Ø 17:06, ott 9, 2005 (CEST)

Nei prossimi giorni butto giù qualche script perl per coordinare i dati in un'unica tabella e ti farò sapere. Qualche preferenza particolare di formattazione per il bot? --Guam->@ 17:19, ott 9, 2005 (CEST)
Direi nessuna. Riguardo ad accenti e segni vari, è bene che le stringhe siano codificate in Unicode. Il foglio elettronico (o il testo CSV) contenente i dati verrà dato in pasto ad una "stampa unione" modellata sull'articolo standard. Il risultato (un lungo file di testo del tipo titolo<<testo>>titolo<<testo>>titolo<<testo>>...) verrà dato in pasto al bot, che provvederà al caricamento. Ciao. --Paginazero - Ø 17:24, ott 9, 2005 (CEST)

Certo, questa posizione è ragionevole, come peraltro un commento sulla Wikipedia inglese nota:

Only small subsets of filmographies are allowed to be quoted, and only on non-commercial websites. The latter restrictions on the use of data may be unenforceable, as the U.S. Supreme Court in Feist v. Rural ruled that collections of facts are not protected by copyright.

In ogni caso io ci andrei con le pinze sia come dimensioni che come utilizzo dei dati. Diciamo che si può utilizzare (almeno ufficialmente) come strumento di verifica offline piuttosto che come fonte dei dati. --Abragad 17:30, ott 9, 2005 (CEST)

Occorrerebbe definire quanto piccolo deve essere il subset. Se consideriamo solo i titoli italiani probabilmente abbiamo già una prima riduzione. Certo la soluzione più elegante sarebbe un database completamente free. --Guam->@ 17:40, ott 9, 2005 (CEST)
Parli di subset in riferimento alla citazione qui sopra? Il problema in realtà è l'uso commerciale dei dati, perché se si rilascia la pagina generata sotto la GFDL, questa potrebbe a sua volta venire incorporata in un progetto commerciale, p.es. una guida a stampa creata a partire dal Progetto Cinema di Wikipedia. --Abragad 18:50, ott 9, 2005 (CEST)
Mi pare di intendere che si possa prendere per citazione solo una piccola parte dell'elenco di filmografie. Ma le filmografie sono in riferimento ad un attore o regista (la filmografia di ...). Un semplice elenco di titoli è una fimografia? E anche se fosse così, come è possibile dimostrarne la provenienza? --Guam->@ 19:54, ott 9, 2005 (CEST)
Segnalo per la cronaca che l'elenco completo in inglese comprende circa 469000 titoli, mentre l'elenco in italiano circa 18000. --Guam->@ 17:58, ott 9, 2005 (CEST)
"Elenco in italiano" = "Elenco di film con un titolo in italiano"? Mi sembrano più che sufficienti, sia perché sono quelli conosciuti e distribuiti in Italia, sia perché di più e il resto dei wikipediani uccide il bot sulla pubblica piazza :-) L'unico dubbio è che magari manchino i film che hanno un titolo identico in originale e inglese (p.es. Manhattan --Abragad 18:50, ott 9, 2005 (CEST)
Ci sono diversi titoli identici (American Beauty, Pulp Fiction, Shakespeare in Love) , ma mi sono accorto che mancano molti titoli, tra cui Sabrina, Manhattan e altri ed ho paura che alcuni non siano tradotti. --Guam->@ 19:54, ott 9, 2005 (CEST)
l'ideale sarebbe occuparsi solo dei film che hanno più 200 voti. Eescludendo quelli per la Tv dovrebbero essere in tutto quasi 13.000 titoli. I file del database non li ho visti, ci sono le info sui voti? -- Lilja msg 21:52, ott 9, 2005 (CEST)
Ci sono, ci sono.--Guam->@ 09:45, ott 11, 2005 (CEST)

E questa banca dati non è utilizzabile (chiedo ai tecnici, sempre)? shaka 10:50, ott 11, 2005 (CEST)

qui non dice molto, bisognerebbe conttatare la redazione. Comunque i dati non possono essere estratti attraverso l'interfaccia web senza autorizzazione, potrebbe essere visto come un reato informatico. Occorrono i file. --Guam->@ 11:01, ott 11, 2005 (CEST)

IMDb e chiedere l'autorizzazione?

E se richiedessimo l'autorizzazion esplicita a IMBd? Magari ci concederebbero l'uso di dati quali trivia e plot. Magari sottolineando che le nostre schede puntano spesso al loro sito... Ci vorrebbe però qualcuno che mastichi bene l'inglese. Che ne dite? --Guam->@ 09:45, ott 11, 2005 (CEST)

Al 99,9% diranno di no, e a quel punto non potrai più sostenere che non hai utilizzato i loro dati. La politica di licensing è abbastanza chiara. --Abragad 09:55, ott 11, 2005 (CEST)

Più che altro tutte le informazioni sono in inglese, e quindi andrebbero comunque tutte tradotte; a questo punto traduciamo quelle di en.wiki che sono migliori. Gli unici dati, quindi, che possiamo e ci serve di prelevare sono quelli per riempire la tabella e basta, IMHO. shaka 10:42, ott 11, 2005 (CEST)

Titoli in italiano

I titoli dei nuovi articoli sui film dovrebbero riportare il titolo in italiano. Sarebbe quindi importante reperire un database con anche i titoli italiani, oppure sottoporci ad anni di spostamenti manuali dei nomi ;). --Marcok 21:39, ott 8, 2005 (CEST)

E' il caso?

L'ho già scritto al bar e lo ripeto qui. Mi (e vi) faccio questa domanda: è il caso di farlo? Credo che già ora circa metà degli articoli sia futto esclusivamente del lavoro dei bot (al limite gli umani hanno fatto qualche correzione a mano). Vogliamo continuare così? Fare di wiki un insieme di tabelle con due righe di cappello (scritte anche quelle da un bot)? A me non piacerebbe.

Dubito che si troverà un dbase che fa al caso nostro, ma se così fosse propongo di fargli inserire solo i film per i quali c'è già la voce per un attore o regista o sceneggiatore ecc. In pratica solo quelli inseriti nella filmografie --TierrayLibertad 14:44, ott 11, 2005 (CEST)

L'idea è proprio quella di inserire titoli di cui si hanno un minimo di dati e un minimo di notorietà. Ad ogni modo, nel caso dell'inserimento di articoli su film, la parte più noiosa è proprio copiare e compilare la tabella. Avere schede già pronte favorirebbe a mio avviso l'inserimento di dati. Si tratterebbe di 10K-15K voci. --Guam->@ 15:07, ott 11, 2005 (CEST)
Se ci si limitasse a botti di 100-200-500 film alla volta? Procedendo nell'ordine dei film più votati all'Internet Movie Database (che vale come qualsiasi altra classifica, ma è ragionevolmente una classifica "popolare") si possono inserire i film mancanti, poi creare una pagina di discussione e invitare la gente a de-stubbare. Attendere un paio di settimane, aumentare. Immagino che i primi batch sarebbero molto piccoli, credo che i film più popolari siano tutti già presenti. --Abragad 15:39, ott 11, 2005 (CEST)

+1 su Abragad. Procederei in ordine cronologico inverso con tranches di un centinaio circa di voci. --Paginazero - Ø 21:42, ott 12, 2005 (CEST)

Bozza

In Wikipedia:Portale Cinema/Cinebot/bozza ho messo un esempio di come apparirebbe una pagina creata dal bot. È in effetti un esempio dei più scarni, il film è di inizio secolo. I film italiani che non necessitano di disambigua sono 4422. --Paginazero - Ø 21:22, ott 12, 2005 (CEST)

Ritorna alla pagina "Cinema/Cinebot".