По умолчанию обе программы (Сканфильтр и Скания) в тексте объявления ищут группы цифр, похижие на телефон, т.е. определённое количество цифр, разделённых между собой, например, такими символами, как пробел, тире, скобки и т.д.
Для задания или изменения образца поиска телефонов в тексте объявлений откройте папку "\Документы\Scanfilter4\", откройте текстовый файл RegExp.txt (или reg2.txt для Скании), первая строка файла - это и будет рабочий образец поиска телефонов (регулярное выражение). Остальные - для примера.
Заказывайте, какие условия поиска нужны. Постараемся сделать.
Сканфильтр - это программа поиска телефонов посредников, обработки телефонов с последующим импортом в программу Квартал ПРО
Примечание!
Если вы сканируете печатную газету на сканере с последующим распознаванием в текст, то обязательно прочтите эту тему на форуме >>
Стоп-список телефонов
В программе Сканфильтр есть игнор-лист (стоп-список). Это файл SkipPhones.txt "\Документы\Scanfilter4\". Он тоже состоит из регулярных выражений, но в этом файле все строки рабочие.
Для чего нужен стоп-список? Бывает так, что цена объекта оцень похожа на номер телефона или в тексте объявления есть WWW-ссылка на объявление, а в ссылке есть длинный ID, который тоже состоит из цифр и тоже похож на номер телефона. Получается, что такие группы цифр нужно временно удалить, проигнорировать перед началом поиска телефонов в тексте объявления.
Например, ссылка вида: https://site-name.ua/id/06855191254. Сканфильтр группу цифр "06855191254" примет за номер телефона, а чтобы этого не произошло, в стоп-список можно добавить выражение "id\/\d+" без кавычек.
Просмотров: 31525