Иногда так случается, что в объявлении есть слова и/или словосочения, которые очень похожи на названия улиц или районов.
Стоп-список улиц
Например, в объявлении объекта, который находится на улице Харьковской может быть словосочетание "Витебская область" и при этом в базе Квартал ПРО есть и улица с названием "Витебская", т.е. может получится так, что Сканфильтр вместо улицы "Харьковская" подставит неправильное - "Витебская".
Из текста объявления можно предварительно удалить "Витебская область" и тогда Сканфильтр не найдет слово "Витебская" в объявлении, а найдет слово "Харьковская" и правильно определит улицу.
Функция работает так, что из текста объявления удаляется конкретный кусок текста и только потом начинается поиск улицы.
Пример объявления.
[Брестская, Брест, Скрипникова] 1-комнатная квартира, 1985 г.п., 3/9 кирпичного, 36,9/35,2/17,6/7,1, с/у раздельный и т.д.
В справочнике улиц Квартал ПРО есть и улица "Брестская", и улица "Скрипникова". Но если из текста объявления не удалить слово "Брестская", то Сканфильтр примет это слово (название области в данном случае) за название улицы.
Поэтому в стоп-список улиц нужно добавить строку "[Брестская, " без кавычек, т.е. со скобкой, с запятой и пробелом. Т.е. нужно удалить конкретное определение области, а не просто слово "Брестская". Тогда Сканфильтр найдет улицу Скрипникова. Просто может оказаться так, что в объявлении будет и Брестская область и Брестская улица, вот определение улицы нужно оставлять, а определение области нужно удалять.
Ещё пример.
[Брестская, Брест, Брестская] 1-комнатная квартира, 1985 г.п., 3/9 кирпичного, 36,9/35,2/17,6/7,1, с/у раздельный и т.д.
Здесь видно, что и название области, и название улицы совпадают. Именно поэтому нужно использовать в стоп-списке строку "[Брестская, ", а не "Брестская", т.е. сузить поиск до определения области. После удаления этого куска текста останется:
Брест, Брестская] 1-комнатная квартира, 1985 г.п., 3/9 кирпичного, 36,9/35,2/17,6/7,1, с/у раздельный и т.д.
и Сканфильтр определит, что в тексте есть улица Брестская.
А если в стоп-список добавить "Брестская", то предварительно будут удалены оба слова и останется:
[, Брест, ] 1-комнатная квартира, 1985 г.п., 3/9 кирпичного, 36,9/35,2/17,6/7,1, с/у раздельный и т.д.
В этом случае Сканфильтр не найдет улицу совсем.
Стоп-список улиц - это простой текстовый файл SkipStreet.txt, который можно редактировать Блокнотом. Файл находится в папке:
\Документы\Scanfilter4\
Стоп-список районов
Стоп-список районов действует по точно такому же принципу, как и стоп-список улиц - из текста объявления удаляется конкретный кусок текста и только потом начинается поиск названия района в тексте объявления.
Стоп-список районов - это простой текстовый файл SkipRegions.txt, который можно редактировать Блокнотом. Файл находится в папке:
\Документы\Scanfilter4\
В настройках каждого профиля есть возможно указать свой отдельный файл со стоп-списком:
Перед началом обработки данных, Сканфильтр пытается найти и загрузить эти файлы. Если файлов нет с такими названиями, то Сканфильтр будет пытаться загрузить файлы со стандартными именами, т.е. "SkipStreet.txt" и "SkipRegions.txt"
Перегляди: 15029