[RISOLTO]URLs friendly di pagine dinamiche per motori di ricerca

28 contenuti / 0 new
Ultimo contenuto
[RISOLTO]URLs friendly di pagine dinamiche per motori di ricerca

Ciao ragazzi, da un paio di giorni sto perdendo tempo nel cercare di capire una cosa (ditemi se sto perdendo tempo).
Drupal, anche con il clean URLs attivo, quando visualizza pagine dinamiche (pagine che contengono il paging 1, 2, 3, ecc...) visualizza il percorso con ......?page=1, .....?page=2, ....?page=3, ecc....
Sembrerebbe che questo, oltre a non essere user friendly, non piace neanche ai motori di ricerca che non indicizzano le pagine.
Wordpress sembra che abbia risolto il problema con qualche plugin; se vediamo qualche sito in Wordpress, vediamo che le pagine con il paging finiscono con ..../page/2/, ..../page/3/, ecc...
oltre all' URL più amica, Wordpress genera anche un titolo diverso mettendo dopo il titolo (tag) part 2, part 3, ecc... evitando in questo modo di avere pagine con titoli duplicati.
Nei siti sviluppati con Drupal, non ne ho visto uno che al momento risolve il problema, compresi D.I e D.O.
Su D.O. il problema è stato affrontato quì e quì e sono state date anche delle soluzioni che non sono riuscito ad applicare. La via del RewiteRule in htaccess, provata, in tutti i modi non ha funzionato e neanche provando il modulo cleanpager. Ritengo che un modulo possa essere la soluzione migliore, ma quale ? esiste ? Tra l' altro il modulo, oltre a creare una url pulita, dovrebbe generare anche un titolo diverso ed canonical url diverso.
Sto perdendo tempo ? Vale la pena ? Ci sono soluzioni ?
Ciao.

la seconda che hai detto

Lavatrice ad ultrasuoni
Sito http://www.ultrasuoni.net > Client service and contacts: [email protected]

Mi sa tanto che bisogna provare con questo. Non riesco ad immaginare che Wordpress possa essere meglio di Drupal.

Boost mi genera una marea di pagine incomprensibili. Forse dipende dal tema o perchè lo provo in test in un sottodominio.

Questo l'hai collaudato ?

http://drupal.org/project/cleanpager

Quote:
Impaginazione Clean è un modulo molto semplice che consente di attivare impaginazione pulita URL per le pagine specificato. Il Drupal modo in cui funziona in genere, se si ha una vista con l'URL 'my-view', le pagine successive di norma utilizzare una query per passare il numero di pagina, come in 'la mia vista? Page = 2'. Quando paginazione Clean viene utilizzato per una pagina, verrà creato un URL del tipo 'il mio-view / 2'.

PS
Giò, hai sentito che dice il Cern? Oltre il 25% dell'universo è "materia oscura"
§:DD

Lavatrice ad ultrasuoni
Sito http://www.ultrasuoni.net > Client service and contacts: [email protected]

Cleanpager è stato il primo che ho provato, dopo aver provato anche con htaccess. Cleanpager non funziona con gli alias generati da Pathauto. Potrebbe però essere una base per sviluppare un nuovo modulo (cosa che non so fare).

giovanninews wrote:
Ciao ragazzi, da un paio di giorni sto perdendo tempo nel cercare di capire una cosa (ditemi se sto perdendo tempo).
Drupal, anche con il clean URLs attivo, quando visualizza pagine dinamiche (pagine che contengono il paging 1, 2, 3, ecc...) visualizza il percorso con ......?page=1, .....?page=2, ....?page=3, ecc....
Sembrerebbe che questo, oltre a non essere user friendly, non piace neanche ai motori di ricerca che non indicizzano le pagine.

E' una vita che questo problema è stato risolto dai motori di ricerca:

Quote:
http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-stati...

Su pizza.it (dove ci sono 750+ pagine di thread di forum) google mi sta indicizzando normalmente tutto, andando nelle varie ?page=

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

@ziobudda
Grazie per il link di Google; non lo sapevo ! E' vero che le pagine del forum di pizza.it sono indicizzate. Con il mio sito questo non succede. E' perchè gli da fastidio il canonical url o solo perchè le visite non sono numerose come su pizza.it ? Se ti va fammi sapere. Ciao.

Hai messo una sitemap.xml per il tuo sito web ? Hai detto a google del tuo sito web ? Non è che hai qualche cosa nel file robots ?
Ma esattamente cosa devi indicizzare del tuo sito utilizzando page= ?

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

Ciao, e grazie per la risposta.
La sitemap c' è, google è avvisato, nel robot non vi è niente di particolare (originale !). Devo indicizzare tutte le pagine dinamiche generate dai secondary link. Google mi indicizza tutto (le pagine statiche), ma non indicizza quelle dinamiche.
G.

Hmmm... sicuro che nel file sitemap.xml ci siano quelle dinamiche ? Per intenderci: nel file sitemap.xml ci sono i link ai vari nodi contenuti nelle varie ?page= ?

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

Ciao zio (anche se per età potrebbe il contrario). Vedo che sei preso da altre discussioni (lilo può scegliere chi vuole, l' importante è la considerazione che abbiamo di noi stessi).
Per intenderci questa http://giovanninews.com/categoria/internet è indicizzata, mentre questa http://giovanninews.com/categoria/internet?page=2 non è indicizzata.
Ho il sospetto che il mio sito ha qualche problema di configurazione.
G.

Ciao, attento: le categorie non si indicizzano mai, altrimenti la maggiorparte delle volte si finisce penalizzati per contenuto duplicato.

Via sitemap.xml dici a google quali sono le pagine con i contenuti. Se gli fai indicizzare anche le categorie lui trova contenuto doppio.

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

Questa non è certo una bella notizia,
su wp le categorie nella Sitemap decidi tu come o meno metterle e non ho trovato problemi, per quello che posso vedere io.

Lavatrice ad ultrasuoni
Sito http://www.ultrasuoni.net > Client service and contacts: [email protected]

Attento: non è un problema di Drupal. E' google che ti penalizza per contenuto duplicato. E' cosa che a livello SEO si fa sempre.

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

quindi nonnogiovanni ne ha tirata fuori un'altra delle sue che è importante (tipo quella dei famosi Feeds),
avevo notato che un sito mi dava delle doppie in webmaster .. ma adesso la cosa mi stà seriamente preoccupando, cribbio altri problemi..

Lavatrice ad ultrasuoni
Sito http://www.ultrasuoni.net > Client service and contacts: [email protected]

@ziobudda

Quote:
Ciao, attento: le categorie non si indicizzano mai, altrimenti la maggiorparte delle volte si finisce penalizzati per contenuto duplicato.

Via sitemap.xml dici a google quali sono le pagine con i contenuti. Se gli fai indicizzare anche le categorie lui trova contenuto doppio.


Scusate se nella discussione tiro in ballo qualcuno che non è presente, ma che per me è un punto di riferimento.
Per capirci meglio, nel mio sito utilizzo XML Sitemap. Se lo uso abilitando XML Sitemap ed XML Sitemap node, ottengo un file sitemap.xml con tutti i nodi reali (circa 400); se abilito anche XML Sitemap taxonomy, ottengo un file sitemap.xml di circa 1200 nodi (finora tutte pagine statiche, quasi tutte indicizzate, contenenti tutti i nodi con in più categorie con relativi tag che vengono da due vocabolari, uno per le categorie ed uno per i tag che si riempie automaticamente). In questo modo, avendo un maggiore numero di pagine indicizzate, ottengo in questo modo un 20% di visite in più (perchè, a volte, la pagina indicizzata per categoria/tag nella SERP supera il posizionamento del nodo effettivo. Non ho finora titoli duplicati, in quanto il titolo è il nome del tag (quindi diverso dal titolo del nodo) e in questo caso non vi è una descrizione (che potrebbe portare ad una descrizione duplicata); inoltre ho il canonical url che punta sempre, in base al caso, o alla url del nodo oppure alla url categoria/tag. E' quì che entrano in gioco le pagine dinamiche, generate nel mio caso dai nuovi articoli che vengono archiviati per una determinata categoria, ma che potrebbero essere anche quelle generate dal blog (/blog?page=2, /blog?page?=3, ecc...) o quelle generate dal forum (/forum?page=2, /forum?page=3, ecc...). Presumo che, nel mio caso, le pagine dinamiche non sono indicizzate proprio perchè utilizzo il canonical url; la pagina dinamica http://giovanninews.com/categoria/internet?page=2 probabilmente non è indicizzata perchè il canonical url è sempre , uguale a quello della pagina dinamica http://giovanninews.com/categoria/internet?page=3. Se tolgo il canonical url, forse indicizzerei le pagine dinamiche che mi portebbero un ulteriore incremento delle visite del 20%, ma avrei anche una marea di titoli duplicati (in questo caso il titolo è sempre la categoria).
Ziobudda probabilmente non utilizza su pizza.it XML Sitemap perchè non lo vedo; comunicherà a Google la sitemap in qualche altro modo; le pagine dinamiche sono indicizzate come ad esempio http://www.pizza.it/forums/allthreadpage?page=2 . Ma pizza.it non utilizza il canonical url; il mio sospetto è che possano esserci tanti titoli duplicati.
Adesso tiro in ballo chi non è presente e chiedo scusa.
Mavimo, mi pare di capire, come me utilizza XML Sitemap ed indicizza nodi, categorie e tag; Mavimo inoltre, come ziobudda, indicizza anche le pagine dinamiche, ad esempio http://mavimo.org/drupal?page=2 ed anche lui, come ziobudda, non utilizza canonical url; il sospetto è che anche quì vi siano tanti titoli duplicati.
Sembrerebbe che Google dichiari di non penalizzare i siti web che hanno titoli duplicati, per cui probabilmente proverò a togliere canonical url per vedere cosa succede.
Se non è per questo vuol dire per forza che il mio sito ha qualche errore di configurazione che cercherò di scovare, ed ho già qualche sospetto.
In ogni caso, per tornare all' inizio, sembra che Wordpress abbia un plugin, a differenza di Drupal, che trasforma l' url /categoria?page=1 in /categoria/page/1 ed allo stesso tempo trasforma il titolo della pagina in "Internet", "Internet pagina 2", "Internet pagina 3", ecc..., evitando in questo modo i titoli duplicati sulle pagine dinamiche.
Scusate se ho spulciato un pò i cavoli vostri.
G.

Qualcosa ho trovato.
Sul modulo Meta Tag (Nodewords) ho disabilitato l' opzione Repeat meta tags for lists. Questa opzione replica i metatag anche nelle pagine con il pager e, da quanto descritto nel modulo, alcuni motori di ricerca penalizzano i siti che utilizzano gli stessi metatag in pagine diverse.
Ho inoltre disabilitato il canonical url; vediamo adesso cosa succede con i titoli duplicati.
G.

@giovanninews: "titoli duplicati" ??? Il titolo è uno dei 200+ parametri che vengono considerati da google al momento di restituire le serp. Non è il titolo che fa una pagina "duplicata", è il contenuto della pagina. Le categorie poi creano moltissimi link interni. Praticamente un mezzo casino con le varie cose di google.

Per la sitemap.xml: errore mio. Ho disabilitato un po' di moduli per cercare di velocizzare il sito, e stavo facendo un po' di prove, ma si vede che ho disabilitato un modulo di troppo. Grazie per la segnalazione.

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

La tua sitemap è ancora invisibile. Comunque mi sa che ero l' unico ad utilizzare il canonica url.
Conoscete qualcuno che usa canonical url ed ha le pagine dinamiche indicizzate ?
Per far ripassare Google dovrei fare aggiornamenti, ma ora non ne ho voglia.

Si comincia a vedere qualche pagina dinamica indicizzata.
Per i titoli duplicati è ancora presto !

Le pagine dinamiche indicizzate aumentano. E' un dato di fatto che canonical url impedisce l' indicizzazione delle pagine dinamiche. Per ora non ci sono titoli duplicati; aspettiamo ancora.
Questo thread, a questo punto, è il seguito di quello iniziato circa un anno fa e che sembrava concluso:
http://www.drupalitalia.org/node/10078

Tienimi(ci) informato che la cosa interessa.

M.

--
Michel 'ZioBudda' Morelli -- [email protected]
Sviluppo applicazioni CMS DRUPAL e web dinamiche -- Corsi Drupal -- Amministrazione Drupal -- Hosting Drupal

@giovanninews: non sono per nulla esperto, ma mi risulta che la tag "canonical" serve proprio a rimuovere le url dinamiche, o meglio a fare in modo che miosito/nodo e miosito/nodo?page=1 abbiano la stessa URL.
o sbaglio?

Approfitto per farti una domanda sulla tua sitemap.xml (giovanninews.com): come riesci a visualizzare le pagine in ordine di priorità?
Grazie

@bohz

Quote:
ma mi risulta che la tag "canonical" serve proprio a rimuovere le url dinamiche, o meglio a fare in modo che miosito/nodo e miosito/nodo?page=1 abbiano la stessa URL.
o sbaglio?

Sembrerebbe che canonical url invece non faccia indicizzare le pagine dinamiche; queste ci sono sempre, ma quando passa il crawler, trova il pager della pagina dinamica, va alla pagina ?page=1, trova canonical url e quindi ritorna al punto di prima, non indicizzando le pagine dinamiche. Infatti, non abilitando da Nodewords (Meta tags) canonical url, le pagine dinamiche sono indicizzate, ma come prevedevo, adesso comincio ad avere i titoli duplicati.
Inoltre è corretto non abilitare l' opzione Repeat meta tags for lists, perchè altrimenti avrei, oltre al titolo duplicato, anche descrizioni e chiavi duplicate (e quì potrebbe esserci la pagina duplicata).
Ma Google afferma di non penalizzare i siti con i titoli duplicati, per cui, dal lato SEO, è meglio avere titoli duplicati ma maggiori pagine indicizzate.
Questo è un punto a favore di Wordpress che, quando vi sono pagine dinamiche, aggiunge part 2, part 3 ecc... al titolo; è quello che dovrebbe fare anche il modulo Nodewords.
RISOLTO
Nel modulo Page Title, scegliendo il Token giusto in "Pattern for pages that contain a pager: ", si ottiene lo stesso effetto di Wordpress. In pratica, su "Pattern for pages that contain a pager:", ho messo /part/[current-page-number]
Quote:
Approfitto per farti una domanda sulla tua sitemap.xml (giovanninews.com): come riesci a visualizzare le pagine in ordine di priorità?

XML Sitemap sembra che lo faccia da solo. Io ho soltanto messo priorità 1 alla homepage e priorità 0,9 ai primari e secondary links in fase di creazione. Di default la priorità è 0,5 e XML Sitemap aggiunge qualche decimo alle pagine più commentate ed alle pagine più lette.

Quote:
Sembrerebbe che canonical url invece non faccia indicizzare le pagine dinamiche;

proprio quello che dico:
miosito/nodo
miosito/nodo?page=1
miosito/nodo?page=2

è sempre <link rel="canonical" href="http://miosito/nodo">[/codefilter_code]

Per xmlsitemap: ho capito, grazie mille

Scusate potreste spiegarmi cosa si intende per categoria? Soprattutto, visto che ci siamo come si fa a non creare contenuti duplicati per errore? Grazie e perdonate la banalità dovuta alla mia inesperienza

Alex

Approfitto della domanda di Alessandro per aggiornare questo post.

Sono passati più di 4 anni, sono passato da D6 a D7 e domani uscirà la D8.
D8 promette bene, ma prima di fare il passaggio aspetterò almeno qualche altro mese, affinchè D8 sia più stabile e sia fatto il porting di moduli fondamentali (mi dispiace che non si stia ancora lavorando ad esempio con il modulo Insert).

In merito a questo posto devo dire che era quasi tutto errato.
Aveva ragione ziobudda sui contenuti duplicati: categorie e tag non vanno indicizzati perchè producono duplicati che sono penalizzati da Google.

Vanno indicizzate solo le pagine uniche, le pagine che contengono contenuti, quelle che nel linguaggio Drupal si chiamano nodi e non quelle che si chiamano taxonomy. Inoltre bisogna togliere dall' indice i nodi che possono essere copiati, ad esempio la pagina sulla privacy ed i nodi con scarso contenuto, ad esempio quelli generati da webform.

Per rispondere ad Alessandro, i termini categorie e tag appartengono più a Wordpress che a Drupal; in Drupal l' equivalente sono i vocabolari ed i termini della tassonomia, che possono essere incrociati o separati ed offrono un controllo molto più sottile.