Jump to content
Sign in to follow this  
mademoiselle

[RESOLU]Probleme robots.txt

Recommended Posts

Bonjour la communauté,

J'essaye actuellement de généré le fichier robots.txt et peanut...
Résumé:
chez Planethoster en mutualisé, presta V.1.2.1
URL simplifié possible donc activée,.htaccess généré (et regénéré après tentative selon ce que j'ai pu lire ici), création d'un fichier vide robots.txt au niveau de public_html/adminMSM...lancement par http://www.monsite.com/robots.txt : et je tombe sur une page me disant "page introuvable : la page que vous avez demandée n'existe PLUS"...??!!

Cela inspire-t-il qlq'un car j'ai fais le tour du forum sur le sujet et apparement, les problèmes ne sont pas similaires...

Merci d'avance et doux day à tous !

Share this post


Link to post
Share on other sites
Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)

Share this post


Link to post
Share on other sites
Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)

Bon apparement, ce n'est pas la solution...pourtant c'était une possibilité puisque ça marche avec l'install photoshop et celle de crawltrack...utilisé le bloc et ftpété, ok, mais peux-tu me dire où je trouve le contenu/ un exemple de texte à mettre, s'il te plait ?

Share this post


Link to post
Share on other sites

Désolé dans les choux et sur les marchés de noyelle ki commencent...

As tu eu ton fichier? sinon je te l'envoie par MP

Share this post


Link to post
Share on other sites
Avec bloc-notes?

Bonjour Alain,

non...euh, ça va (surement) faire rire mais bon, je suis un brin newbie dans le domaine : dans le back office, il y'a indiqué "génération du fichier" cependant il n'y a pas de touches clicable comme pour le .htaccess juste au-dessus, j'ai donc créer le fichier puis suis aller sur mon site dans mozilla en tapant l'adresse http://www.monsite.com et ai lancer..."page introuvable" apparait alors...

Comment utiliser le bloc-note, c'est à dire où trouver le texte a y mettre, s'il te plait (puisqu'il n'y a de génération automatique dans le B-O) ?

:)

pour la generation automatique, il faut que le BO trouve un fichier du meme nom (meme avec rien dedans). Alors, et seulement , le bouton pour la generation automatique est activé.
tu crees donc un fichier robots.txt, vide, a la racine du site , et hop ....

Share this post


Link to post
Share on other sites

Oui, le fichier robots.txt doit être à la racine de ton site (plus haut tu parles d'un dossier "Admin"...). De plus il doit avoir les permissions en chmod 777.

Share this post


Link to post
Share on other sites
Désolé dans les choux et sur les marchés de noyelle ki commencent...

As tu eu ton fichier? sinon je te l'envoie par MP

Bonsoir Alain,
oui-oui, c'est le rush en ce moment !!!
J'ai fini par trouver effectivement, je l'avais placer au mauvais endroit donc le bouton du b-o ne s'afficher pas...!
Il est généré et tout, et tout : perfecto !

Merci à toi,
Je te souhaite des good deal à venir en cette période ! ;-)

Mlle !

Share this post


Link to post
Share on other sites

pour la generation automatique, il faut que le BO trouve un fichier du meme nom (meme avec rien dedans). Alors, et seulement , le bouton pour la generation automatique est activé.
tu crees donc un fichier robots.txt, vide, a la racine du site , et hop ....

C'est fait...l'erreur était bien l'endroit du fichier...
Mais maintenant que c'est fait, et merci de ton aide (!!), j'ai une question de newbie qui me trotte dans la tête...ben oui !
- LA question à 2 balle :
Pourquoi dans la liste des disallow #directories ne figurent pas certains fichiers situés à la racine comme, par exemple, contact, css, docs, img, js ou le fameux .htaccess ???
Les robots pourraient-ils lire le .htaccess alors que celui-ci est là pour assurer une certaine sécurité ?! :roll:
Y'a un truc qui m'échappe là... :wow: :-S

ça te parle ou je psychotte ? :red:
Nan, parce que la sécurité, faut pas plaisanter...

Merci à toi, Zeiser50, pour ton aide,
Bonne soirée,
Mlle.

Share this post


Link to post
Share on other sites
Oui, le fichier robots.txt doit être à la racine de ton site (plus haut tu parles d'un dossier "Admin"...). De plus il doit avoir les permissions en chmod 777.

Merci Patrick, et à tous, pour votre aide !

Des fois, le terme "racine" n'est pas forcément clair pour un débutant...du coup j'ai chercher sur d'autres sites et ai trouver que la racine se situe au même niveau que le fichier index.php : si ça peut aider qlq'un dans le futur...
Je vais mettre un p'tit "résolu" au file...

Bonne soirée, :)
Mlle.

Share this post


Link to post
Share on other sites

Le fichier robots empêche les robots qui indexent ton site de référencer certains fichiers (pas de lecture possible). Les fichiers a la racine sont les fichiers standards (de PS) et donc, il n'y a pas d'intérêt a limiter l'accès.

La sécurité se fait plus par le .htacccess.

Du moins, c'est ma compréhension (je suis en phase newbie expert :-))

Share this post


Link to post
Share on other sites
Le fichier robots empêche les robots qui indexent ton site de référencer certains fichiers (pas de lecture possible). Les fichiers a la racine sont les fichiers standards (de PS) et donc, il n'y a pas d'intérêt a limiter l'accès.

La sécurité se fait plus par le .htacccess.

Du moins, c'est ma compréhension (je suis en phase newbie expert :-))

Je reste quand même en interrogation...
Je développe :
Le fichier robots.txt généré à la racine se situe à la même place que d'autres fichiers/dossier, dont le fameux .htaccess.
Or dans le contenu du robots.txt, il y'a une liste de disallow visant certains, mais pas tous, fichiers/dossiers situés au même niveaux que lui, c'est-à-dire à la racine...pourquoi seulement certains ?
Et pourquoi le .htaccess ne fait pas parti de la liste des disallow ? D'autant plus qu'il vise à la sécurité...a ton avis, est-il consutable par un robot ?
C'est ça en fait qui me fait buggé... :bug:

ça t'inspire qlq chose ? :roll:

Copier-coller du robots.txt, 1 ère partie :
# Directories
Disallow: /classes/
Disallow: /config/
Disallow: /download/
Disallow: /mails/
Disallow: /modules/
Disallow: /translations/
Disallow: /tools/

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...

Important Information

Cookies ensure the smooth running of our services. Using these, you accept the use of cookies. Learn More