Manu-shop 34 Posted April 14, 2018 Bonjour, je vois que j'ai des url qui se crée ainsi: https://www.monsite/panier?qty=1&id_product=1070&token=f7b24200c4dbb52d438791db1ffc93f8&add= Ces url se retrouve indexer dans google. mes questions, pourquoi ces urls se génère ainsi, et comment ne pas faire pour les faire apparaitre. presta 1.6 Merci Share this post Link to post Share on other sites
thomasharko 25 Posted April 14, 2018 Bonjour, As-tu un fichier robots.txt à la racine de l'installation ? Sinon sur 1.6 il faut aller dans "Préférences" -> "Seo & urls" et cliquer sur le bouton en bas de page pour le générer Votre fichier robots.txt DOIT être dans le dossier racine de votre site web, et nulle part ailleurs (ex. : http://www.example.com/robots.txt).Générez votre fichier "robots.txt" en cliquant sur le bouton suivant (cela écrasera votre fichier robots.txt actuel) Bonne journée Share this post Link to post Share on other sites
Manu-shop 34 Posted April 14, 2018 22 minutes ago, thomasharko said: Bonjour, As-tu un fichier robots.txt à la racine de l'installation ? Sinon sur 1.6 il faut aller dans "Préférences" -> "Seo & urls" et cliquer sur le bouton en bas de page pour le générer Votre fichier robots.txt DOIT être dans le dossier racine de votre site web, et nulle part ailleurs (ex. : http://www.example.com/robots.txt).Générez votre fichier "robots.txt" en cliquant sur le bouton suivant (cela écrasera votre fichier robots.txt actuel) Bonne journée oui j'ai un fichier robot que faut il que j'ajoute pour bloquer ces urls ou ne pas les faire indexer. pour elle se génère? Share this post Link to post Share on other sites
thomasharko 25 Posted April 14, 2018 Il doit y avoir normalement dans le robots.txt une liste de disallow dont celui-ci qui permet de demander aux moteurs de recherches de ne pas indexer les pages panier. Disallow: /*fr/panier Cela est généré automatiquement lorsque l'on "génére le fichier robots.txt" via le back-office Share this post Link to post Share on other sites
Manu-shop 34 Posted April 15, 2018 J'ai bien Disallow: /*panier dans mon fichier robot.txt celui ci est dans # Files Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 Bonjour, Je rencontre le même soucis avec Google search console> couverture de l'index> Indexée malgré le blocage par le fichier robots.txt Tous les paniers sont indexés alors qu'il y a bien le blocage dans robot.txt, ainsi que certaines pages de modules sans intérêt pour google. Pourquoi google veut indexer ces pages? Comment l'en empêcher et ne plus avoir ces erreurs? Quelqu'un a t'il résolu ce mystère? Merci Share this post Link to post Share on other sites
okom3pom 682 Posted March 13, 2019 Le fichier robot c'est bien mais bon. Si google index ces pages c'est que vous avez eu un problème à un moment. J'utilise des conditions dans le header pour la meta robot Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 ok, pouvez vous nous donner plus de détails svp? Share this post Link to post Share on other sites
okom3pom 682 Posted March 13, 2019 J'utilise ce code qui est totalement personnalisé car vous avez peu être des modules ou autre qui vont jouer. {$array_pages_names = ['best-sales','contact-form','cart','404','order-opc','order','sitemap','supplier','password','my-account','authentication']} {if isset($smarty.get.search_query)} <meta name="robots" content="noindex,follow" /> {else if in_array($page_name, $array_pages_names) || isset($smarty.get.manufacturer_list) || isset($smarty.get.selectProductSort) || isset($smarty.get.theme) || isset($smarty.get.n) || isset($smarty.get.orderby) || isset($smarty.get.orderway) || isset($smarty.get.promo) || isset($smarty.get.id_category_promo) } <meta name="robots" content="noindex,nofollow" /> {else if isset($smarty.get.p) } <meta name="robots" content="noindex,follow" /> {else} <meta name="robots" content="index,follow" /> {/if} Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 Ok, merci, je ne maîtrise pas du tout, du coup je ne sais pas si je n'ose pas le mettre tel quel... merci quand même Share this post Link to post Share on other sites
thomasharko 25 Posted March 13, 2019 Bonjour, Vous envoyer le plan de site à Google avec le module de plan de site ? Dans ce module vous pouvez décocher les cases que vous ne souhaitez pas voir apparaitre. L'étape suivante serait d'ajouter manuellement la balise ci-dessous sur les pages concernées, via le tpl avec des conditions ou via un module qui permet d'ajouter du contenu au header avec des conditions de page. Attention à afficher uniquement la balise sur les pages que vous ne souhaitez pas indexer car si l'affichage se fait sur des pages que vous souhaitez indexer, elles ne le seront plus. <meta name="robots" content="noindex, nofollow"> Bonne journée Thomas Share this post Link to post Share on other sites
okom3pom 682 Posted March 13, 2019 (edited) C'est cette ligne qu'il faut changer :https://github.com/PrestaShop/PrestaShop/blob/1.6.1.x/themes/default-bootstrap/header.tpl#L41 Ca fonctionne très bien chez moiEn gros si page = panier password login contact .... Google n'index pas et ne suit pas Si dans l'url il y a les arguments : manufacturer_list selectProductSort theme n orderby orderway promo id_category_promo Google n'index pas et ne suit pas Si dans l'url il y a l'arguement p Google n'index pas mais suit Sinon Google index et suit Après si vous avez des doutes il y a pleins de freelances sur le forum Edited March 13, 2019 by okom3pom (see edit history) Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 j'utilise le module google sitemap pour générer le sitemap, et les cases à ne pas indexer sont bien cochées, y compris "cart" Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 Merci okom3pom, je teste la modification du header.tpl Share this post Link to post Share on other sites
okom3pom 682 Posted March 13, 2019 Dans tout les cas la console ressort des infos totalement débiles Ce que je regarde c'est le nombre d'url valide qui doit se rapprocher au maximum du nombre d'article que vous avez d'activé Share this post Link to post Share on other sites
Lyn&Or Bijoux 11 Posted March 13, 2019 oui, je trouve la nouvelle console beaucoup moins bien que l'ancienne... Merci et bonne journée Share this post Link to post Share on other sites