Програмски пакет за манипулација со текст

Програмскиот пакет може да се користи со следниве постапки

текст

Во програма Делфи или Слободен Паскал со помош на библиотеката (единица) Миснобол

Следниве датотеки се користат за ова: mysnobol.pas mystring.pas myintarray.pas

Библиотеките беа тестирани со Delphi6, Delphi10 и Lazarus или Freepascal.

Ако нема достапен компајлер за Паскал, можете да го користите преведувачот Паскал - Pscript.

Моделите може да се користат и со апликацијата SnobolIDE. Овде можете да внесете шема за пребарување, која потоа ќе биде заменета со моделот за замена.

Сите потребни датотеки и документацијата се наоѓаат во датотеката snobol.zip

Оваа датотека е целисходно распакувана во директориумот до кој е исто така можен пристап за запишување, на пример, \ appdata \ snobol

Опишани се методи за препознавање и обработка на текст со помош на часови за појавување на обрасци врз основа на програмскиот јазик SNOBOL. Часовите се делумно променети во споредба со моделот SNOBOL со цел да се постигне поголема ефикасност.

СНОБОЛ 4 (С.тринГ. Онемирен симболиценца Л.англиски број 4-ти) е четврта и последна верзија на серија програмски јазици со цел манипулирање со жици. Овие јазици се развиени во периодот од 1962 до 1967 година во лабораториите на АТ & Т Бел, од Дејвид Far. Фарбер, Ралф Е. Грисволд и Иван П. Полонски.

Суштинска карактеристика за разликување од програмските јазици што се користеле во тоа време е постоењето на обрасци како „прва класа“ тип на податоци, т.е. Х. тип на податок, чија вредност може да се манипулира на кој било начин како и во другите програмски јазици, како и од операторите за синџири и манипулирање со обрасци. Стрингови што се генерираат при траење може да се третираат и извршуваат како програма. Шема во SNOBOL 4 може да биде многу едноставна, но исто така и многу сложена. Едноставна шема е на пр. Б. само низа како "ABCD". Сложена шема, од друга страна, може да биде голема структура што на пр. Б. може да ја опише целосната граматика на компјутерскиот јазик. (Википедија)

Во 1970-тите и 1980-тите, СНОБОЛ 4 беше широко користен како јазик за манипулирање со текстот. Во последниве години, сепак, нејзината популарност опаѓа бидејќи поновите и поефикасни јазици како што се Awk и Perl станаа попопуларни за манипулирање со жици со редовни изрази. За разлика од Regex во Перл, SNOBOL дозволува и препознавање на заградени структури што не можат да се опишат со редовни изрази.

(1) Совпаѓање на моделот

Со совпаѓањето на шаблонот во текстовите, се занимава со дефинирање на тест модели (обрасци) кои преку комбинација се во можност да ги опишат структурите за тестирање што се случуваат слободно. Моделите и нивните комбинации треба да бидат препознаени од соодветни алгоритми. Ваквите обрасци се дел од многу програмски и скриптни јазици. Јазикот ЈАВА, на пример, го знае часот токенизатор, каде што може да се подели текст на делови со употреба на сепаратори. Со своите редовни изрази (regex: регуларен израз на Perl), јазикот на скриптите PERL, исто така, има многу моќно помагало за опишување и препознавање на обрасците. Еден од првите јазици специјално насочени кон овој вид обработка на текст беше СНОБОЛ. Пристапот опишан подолу во суштина ги користи моделите дефинирани во SNOBOL. Сепак, тоа не дефинира нов програмски или скриптен јазик, но спроведувањето се одвива преку часови и функции напишани на постоечки јазик (PASCAL-DELPHI). Ова овозможува методологијата да се користи во која било програма напишана на овие јазици. Исто така, можна е имплементација, на пример, во Java или C ++.

Моделите можат да вклучуваат:

Стрингови со дадена должина

сите жици до посебен карактер

најдолг период на празни места

какви било повторувања на низа

Стрингови балансирани во однос на дадени симболи на држачи