Premessa, i nodi sono creati tramite il modulo Feeds.
Esiste un modo per avere una sorta di autotagging dei nodi creati tramite il modulo feeds?
Il modulo feeds, importa contenuto e keywords provenienti dal ogni singolo feed e crea un nodo.
Le keywords importate, popolano un vocabolario.
Il modulo feeds non è ancora attrezzato per un'azione di Taxonomy Compare, però magari è possibile, partendo da un vocabolario di parole chiave specifiche, un'azione automatizzata di autotagging del nodo generato dal modulo feeds.
Avete qualche suggerimento in merito?
Se ci fosse una soluzione sarebbe possibile creare voci di categoria indimpendenti dalle parole chiave importate dal feed.
FORSE, non lo so, non ne sono sicuro, ma qualcosa di affine (alla lontana), che in qualche modo si avvicina a quello che ho espresso qui, viene fatto da Liquida.
http://drupal.org/project/extractor
(e altri moduli citati nella pagina)
Certified to Rock
Ciao bohz,
ho provato il modulo a lungo, tentando di autotaggare i feed importati con il modulo feeds, partendo dalle parole chiave presenti in un vocabolario.
Il risultato è che utilizzando il metodo + semplice, cioè quello che confronta il content con le parola presenti nel vocabolario, non sono riuscito ad ottenere nemmeno un tag. Invece processando il content con Yahoo Placemaker ottengo troppi tag che vanno a popolarmi il vocabolario, rendendolo poco pratico ai fini di definire un insieme di categorie specifiche.
Utilizzando il metodo semplice, riesco ad ottenere dei numeri inseriti nel vocabolario riservato per extractor, credo sia dovuto alla voce "Extracted term tids" inserita nel mapping.
Se riuscissi a capire perchè il mapping Extractred term names non mi funziona a dovere sarebbe meglio. Non è che forse è Case Sensitive?
Mi piacerebbe anche capire come questo modulo viene gestito in http://www.managingnews.com
Mi piacerebbe un sacco riavere le funzionalità di FeedAPI Taxonomy Compare, o di un sistema di Auto Tagging che fosse è versatile.
Suggerimenti?
http://www.sanisapori.eu
Mi sono messo a studiare un pò managingnews.com: alcuni moduli utilizzati, alcune configurazioni, ecc ecc. Quello che ne è derivato è che, nonostante sia semplice nell'essere utilizzato, non lo è proprio tantissimo nelle sue implementazioni.
Ci sono un casino di cose..
La qualità dei prodotti di http://code.developmentseed.org/ mi ricorda quanti progressi devo ancora lavorare bene e con i giusti strumenti.
http://www.sanisapori.eu
mi sembra di capire che stai cercando di fare quello a cui sono interessato anche io ora:
importo tramite feeds e creo dei nodi, adesso ho creato un vocabolario e vorrei popolare il vocabolario di termini inerenti il contenuto del testo importato. è questo quello che stai cercando di fare anche tu jscm?
Sono interessato anch'io, tra l'altro non sono mai riuscito a usare nemmeno FeedAPI Taxonomy Compare
allora..
.. popolare un Vocabolario usando Feeds è semplicissimo, basta impostare la riga giusta nel mapping di Feeds.
Fino a qui non c'è alcun problema e se usate tagaelic vedete il vocabolario popolato per bene.
La cosa che cerco di fare io è
1 - creare un vocabolario con termini specifici e fare in modo che Feeds usi i termini di questo vocabolario per taggare i nodi automaticamente (preferirei che la cosa fosse possibile x + vocabolari, ma purtroppo è possibile solo x uno).
2 - fare in modo che quando il Feed Importer importa e crea il nuovo nodo, oltre a caricare i tag già presenti nel feed all'interno dello specifico vocabolario, subisca un processo di parsing del content e che in base a quello che trova all'interno, scelga uno o + termini tra quelli inseriti in un'altro vocabolario specifico (per esempio un vocabolario di Categorie, con un numero relativamente basso di termini) e lo associ al nodo.
In questo modo è possibile che il sistema in automatico assegni ad ogni nodo almeno un termine specifico di categoria.
Purtroppo questa cosa è complicata, nel senso che difficile che la cosa abbia successo per tutti i nodi importati, qualcuno si perderà purtroppo.
Usando il modulo extractor che completa gli strumenti del modulo Feeds, questa cosa è possibile in 2 modi.
1 - utilizzando le voci di un vocabolario popolato da voi, quindi un numero limitato di termini e quindi un vocabolario che non aumenta di volume, ma qui dovete tenere conto di tutti gli insuccessi legati al tagging, che non saranno pochi.
2 - utilizzare il servizio di yahoo placemaker che funziona alla grande. Quest'ultimo però riuscendo sempre o quasi sempre ad assegnare un tag ai nodi, popolerà in automatico il vostro vocabolario a dismisura, tanto da non avere senso avere un blocco con le voci in colonna. D'altra parte però se già Feeds ti fa importare i tag del post originario, popolando a dismisura uno specifico vocabolario, a che serve usare extractor per popolarne un'altroa dismisura con termini legati si al contenuto ma NON associati sencondo criterio contestuale?!
la questione è... se hai un sito che tratta di TENNIS, vuoi avere un blocco con le categorie affini al Tennis, con cui poter taggare (in automatico) il nodo creato tramite Feeds.
Ora, se io importo un content riferito al tennis, ma al suo interno extractor non trova corrispondenze con i termini del mio vocabolario di categorie (vedi punto 1), quindi non tagga il content, come faccio a migliorare questa cosa?
Come anche, se importo un content riferito al tennis ma extrator mi popola il vocabolario delle categorie di tennis, con temini che non c'entrano nulla col tennis (vedi punto 2 con yahoo placemaker), come faccio a gestire il criterio di tagging di yahoo placemaker?
Sarebbe meglio NON dover dipendere da yahoo (io uso tantissimo google e non mi ha reso felice dover creare un account su yahoo per fare questo test).
La cosa fighissima sarebbe utilizzare yahoo placemaker e poter impostare un criterio di termini per l'autotagging, cioè impostare, oltre la lingua, l'utilizzi di termini specifici del tennis (in questo esempio) e non far crecere a dismisura il vocabolario per le categorie.
FeedAPI Taxonomy Compare non c'entra nulla con tutto questo discorso.
Il suo pregio è quello di analizzare è vocabolari e confrontare i termini importati con quelli dei vocabolari in modo da evitare ricorrenze, nel senso che se un termine si trova in un vocabolario specifico, non viene importanto nel vocabolario generico dei tag (quello che cresce a dismisura). La sua qualità sta anche nel poter operare su + vocabolari (è stato a suo tempo un modulo molto utile).
http://www.sanisapori.eu
non riesco a capire come farlo. non è che hai un link sotto mano dove posso vedere il risultato di ciò che hai detto?
non ho link al momento...!!
bohz tu che suggerisci per meglio gestire e rendere + efficace l'utilizzo di extractor?
Ho notato una cosa che genera un'ulteriore problema... l'extracor PARE faccia il confronto dei tag del vocabolario in maniera Case Sensitive.. e questa è una rottura.
http://www.sanisapori.eu
Ciao.
al momento sono affaccendato in tutte e tante altre faccende. sono fermo a 2 mesi fa con le mie prove su managing news e affini. quindi non posso esserti molto d'aiuto...
Appena ho un attimo mi rimetto a studiare e se ho notizie interessanti te le faccio sapere.
Un primo consiglio che potrei darti e di provare ad utilizzare simple pie come parser per le news.
Certified to Rock
Anche a me non funziona extractor.
Intanto va modificata la lingua se i feeds ed i vocabolari di interesse sono, come credo nella maggior parte dei nostri casi, in italiano, come pure l'elenco delle stopwords (che è ovviamente un arragy dei termini inglesi). Ma questo non è causa del problema che ci affligge