RTF > HTML
01.01.2007
Приведу программу, которую я использую для преобразования содержимого RichEdit в SGML-код. Она не формирует полный HTML-аналог, но вы сами можете добавить необходимый RTF-код и его интерпретацию в HTML-тэги.
Код содержит интуитивно понятные комментарии и строки на шведском языке, нецелесообразные для перевода.
function rtf2sgml(text: string): string; {Funktion for att konvertera en RTF-rad till SGML-text.} var temptext: string; start: integer; begin text := stringreplaceall(text, '&', '##amp;'); text := stringreplaceall(text, '##amp', '&'); text := stringreplaceall(text, '\' + chr(39) + 'e5', 'å'); text := stringreplaceall(text, '\' + chr(39) + 'c5', 'Å'); text := stringreplaceall(text, '\' + chr(39) + 'e4', 'ä'); text := stringreplaceall(text, '\' + chr(39) + 'c4', 'Ä'); text := stringreplaceall(text, '\' + chr(39) + 'f6', 'ö'); text := stringreplaceall(text, '\' + chr(39) + 'd6', 'Ö'); text := stringreplaceall(text, '\' + chr(39) + 'e9', 'é'); text := stringreplaceall(text, '\' + chr(39) + 'c9', 'É'); text := stringreplaceall(text, '\' + chr(39) + 'e1', 'á'); text := stringreplaceall(text, '\' + chr(39) + 'c1', 'Á'); text := stringreplaceall(text, '\' + chr(39) + 'e0', 'à'); text := stringreplaceall(text, '\' + chr(39) + 'c0', 'À'); text := stringreplaceall(text, '\' + chr(39) + 'f2', 'ò'); text := stringreplaceall(text, '\' + chr(39) + 'd2', 'Ò'); text := stringreplaceall(text, '\' + chr(39) + 'fc', 'ü'); text := stringreplaceall(text, '\' + chr(39) + 'dc', 'Ü'); text := stringreplaceall(text, '\' + chr(39) + 'a3', '£'); text := stringreplaceall(text, '\}', '#]#'); text := stringreplaceall(text, '\{', '#[#'); text := stringreplaceall(text, '{\rtf1\ansi\deff0\deftab720', ''); {Skall alltid tas bort} text := stringreplaceall(text, '{\fonttbl', ''); {Skall alltid tas bort} text := stringreplaceall(text, '{\f0\fnil MS Sans Serif;}', ''); {Skall alltid tas bort} text := stringreplaceall(text, '{\f1\fnil\fcharset2 Symbol;}', ''); {Skall alltid tas bort} text := stringreplaceall(text, '{\f2\fswiss\fprq2 System;}}', ''); {Skall alltid tas bort} text := stringreplaceall(text, '{\colortbl\red0\green0\blue0;}', ''); {Skall alltid tas bort} {I version 2.01 av Delphi finns inte \cf0 med i RTF-rutan. Tog darfor bort det efter \fs16 och la istallet en egen tvatt av \cf0.} //temptext := hamtastreng (text,'{\rtf1','\deflang'); //text := stringreplace (text,temptext,''); {Hamta och radera allt fran start till deflang} text := stringreplaceall(text, '\cf0', ''); temptext := hamtastreng(text, '\deflang', '\pard'); {Plocka fran deflang till pard for att fa } text := stringreplace(text, temptext, ''); {oavsett vilken lang det ar. Norska o svenska ar olika} {Har skall vi plocka bort fs och flera olika siffror beroende pa vilka alternativ vi godkanner.} //text := stringreplaceall (text,'\fs16','');{8 punkter} //text := stringreplaceall (text,'\fs20','');{10 punkter} {Nu stadar vi istallet bort alla tvasiffriga fontsize.} while pos('\fs', text) > 0 do begin application.processmessages; start := pos('\fs', text); Delete(text, start, 5); end; text := stringreplaceall(text, '\pard\plain\f0 ', '<P>'); text := stringreplaceall(text, '\par \plain\f0\b\ul ', '</P><MELLIS>'); text := stringreplaceall(text, '\plain\f0\b\ul ', '</P><MELLIS>'); text := stringreplaceall(text, '\plain\f0', '</MELLIS>'); text := stringreplaceall(text, '\par }', '</P>'); text := stringreplaceall(text, '\par ', '</P><P>'); text := stringreplaceall(text, '#]#', '}'); text := stringreplaceall(text, '#[#', '{'); text := stringreplaceall(text, '\\', '\'); result := text; end; //Нижеприведенный кусок кода вырезан из довольно большой программы, вызывающей вышеприведенную функцию. //Я знаю что мог бы использовать потоки вместо использования отдельного файла, но у меня не было времени для реализации этого utfilnamn := mditted.exepath + stringreplace(stringreplace(extractfilename(pathname), '.TTT', ''), '.ttt', '') + 'ut.RTF'; brodtext.lines.savetofile(utfilnamn); temptext := ''; assignfile(tempF, utfilnamn); reset(tempF); try while not eof(tempF) do begin readln(tempF, temptext2); temptext2 := stringreplaceall(temptext2, '\' + chr(39) + 'b6', ''); temptext2 := rtf2sgml(temptext2); if temptext2 <> '' then temptext := temptext + temptext2; application.processmessages; end; finally closefile(tempF); end; deletefile(utfilnamn); temptext := stringreplaceall(temptext, '</MELLIS> ', '</MELLIS>'); temptext := stringreplaceall(temptext, '</P> ', '</P>'); temptext := stringreplaceall(temptext, '</P>' + chr(0), '</P>'); temptext := stringreplaceall(temptext, '</MELLIS></P>', '</MELLIS>'); temptext := stringreplaceall(temptext, '<P></P>', ''); temptext := stringreplaceall(temptext, '</P><P></MELLIS>', '</MELLIS><P>'); temptext := stringreplaceall(temptext, '</MELLIS>', '<#MELLIS><P>'); temptext := stringreplaceall(temptext, '<#MELLIS>', '</MELLIS>'); temptext := stringreplaceall(temptext, '<P><P>', '<P>'); temptext := stringreplaceall(temptext, '<P> ', '<P>'); temptext := stringreplaceall(temptext, '<P>-', '<P>_'); temptext := stringreplaceall(temptext, '<P>_', '<CITAT>_'); while pos('<CITAT>_', temptext) > 0 do begin application.processmessages; temptext2 := hamtastreng(temptext, '<CITAT>_', '</P>'); temptext := stringreplace(temptext, temptext2 + '</P>', temptext2 + '</CITAT>'); temptext := stringreplace(temptext, '<CITAT>_', '<CITAT>-'); end; writeln(F, '<BRODTEXT>' + temptext + '</BRODTEXT>');
Взято из Советов по Delphi от Валентина Озерова
Сборник Kuliba