$aliased_title это динамическая переменная которая прогоняется через функцию парсинга алиаса ($aliased_title = munge_string_to_url($row['news_title']);) где удаляются некорректные символы и пробелы. К сожалению кирилики успешно попадают в раздел некорректных символов.
По ссылке
http://forum.cmsmadesimple.org/index.ph ... #msg115239 предлагается заменить $aliased_title на статичный текст, теоретически в урл новости загоняется ID категории и новости (это и есть
цифирки перед названием файла?), поэтому дублей быть не должно.
Кучи дублей у Вас индексируются (вероятно) из за неправильно настроенных хтаксесса и исключений robot.txt,
посмотрите попадают ли в индекс вызовы не по статичному URL а по обычной динамике (типа news&id=1&category2), если да добавьте динамический вызов в исключение робота или настройте хтаксесс так чтобы такие вызовы редиректились на статичные URL.
У меня робот.тхт стандартный хтаксесс такой:
Code: Select all
DirectoryIndex index.html index.php
IndexIgnore *.php* *.js
AddDefaultCharset utf-8
DefaultLanguage ru-RU
<IfModule mod_rewrite.c>
RewriteEngine on
#
#Sub-dir e.g: /cmsms/
RewriteBase /
#
# 301 Redirect all requests that don't contain a dot or trailing slash to
# include a trailing slash
RewriteCond %{REQUEST_URI} !/$
RewriteCond %{REQUEST_URI} !\.
RewriteRule ^(.*) %{REQUEST_URI}/ [R=301,L]
# Rewrites urls in the form of /parent/child/
# but only rewrites if the requested URL is not a file or directory
#
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.+)$ index.php?page=$1 [QSA]
</IfModule>
в Гуглях дублей не наблюдаю
А еще можно не парить мозг и воспользоватся моим методом,
http://forum.cmsmadesimple.org/index.ph ... #msg114088 (но это лишь сделает красивые урл окончания в виде транслитерированного title новости, это
не решит проблему дублей! (см выше).
Просто функция munge_string_to_url бяка

вернее не продумали попадание в нее кириликов и особенности работы с кирилическими строками в ПХП.