Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Разное

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: простая операция копирования-вставки - проблема с кодировками
 
 автор: elenaki   (07.11.2007 в 13:30)   письмо автору
 
 

дали задачу - разместить на сайте (в CMS) текст в старо-греческом стиле, кодировка
unicode его поддерживает. проблема в том, что я не могу перенести текст из .doc ни в
один HTML-редактор, ни в блокнот, ни в WYSIWYG. при сохранении .doc как .html, ругается
и показывает только иероглифы. а ведь этот текст был сохранен тем же способом (copy+
paste) из другой проги (Shockwave), но на другом компе. потом его дали мне в виде .doc

шрифт там нестандартный, пока не установила его на комп, и в Worde видела одни [].
после установки шрифта вижу текст в Worde, после настройки этим же шрифтом вывода
Proportional Font в Дриме, вижу текст и там, но в HTML он не выводится как надо - или
квадратики или вопросики. другой текст, тоже на старо-греческим, но набранный другим
шрифтом (Palatino Linotype), копируется и выводится нормально.

как сказал шеф, шрифт, которым набран исходный текст, не поддерживает unicode.
и что теперь делать? нашла кучу ссылок про подключение собственных шрифтов, даже
переделала этот дурацкий шрифт из ttf в eot, только он все равно не подключается.
хотя рано еще что-то подключать, надо сначала как-то текст вставить...

   
 
 автор: sim5   (07.11.2007 в 14:01)   письмо автору
 
   для: elenaki   (07.11.2007 в 13:30)
 

&#948;&#968;&#969;&#958;&#961;&#962; - это вставка (Ctrl + C/V) из Word, выбрано - "обычный текст", а это Arial - &#948;&#949;&#950;&#951;&#955;&#956;&#958;. При: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> нормально отображается браузером. Не соображаю в греческом, но указывать шрифт не доступный на клиенте нет смысла, вы и сами об этом знаете.

   
 
 автор: elenaki   (07.11.2007 в 14:15)   письмо автору
 
   для: sim5   (07.11.2007 в 14:01)
 

я совсем запуталась в этих шрифтах и кодировках... в Ворде выбираем шрифт, но не
кодировку. т.е. у каких-то шрифтов при вызове Вставка специального символа можно
выбрать кодировку, в моем случае окошко для выбора кодировки отсутствует. но можно
вставить буковку с помощью alt и цифры. может, можно написать и функцию перекодировки?
понять бы только, что означает U+005A (90). alt+90 выдает нужный символ...

   
 
 автор: Unkind   (07.11.2007 в 14:23)   письмо автору
 
   для: elenaki   (07.11.2007 в 14:15)
 

> понять бы только, что означает U+005A
Символ из таблицы Unicode.
http://www.columbia.edu/kermit/utf8-t1.html

P.S. Хотя вообще-то символы до 0x7F включительно во всех кодировках одинаковые.

   
 
 автор: elenaki   (07.11.2007 в 14:25)   письмо автору
 
   для: Unkind   (07.11.2007 в 14:23)
 

тогда почему шеф говорит, что этот шрифт - не unicode. Блокнот показывает его как Symbol

   
 
 автор: sim5   (07.11.2007 в 14:35)   письмо автору
 
   для: elenaki   (07.11.2007 в 14:25)
 

В Word выбираем шрифт из списка "Шрифт", а из "Набор" выбираем - "греческие и коптские символы". Вам будет виден код в выбранной кодировке и сами символы в выбранном шрифте. Я спокойно вставлял в Блокнот, а затем сохранял как UTF-8, проблем нет.

   
 
 автор: elenaki   (07.11.2007 в 16:32)   письмо автору
 
   для: sim5   (07.11.2007 в 14:35)
 

в том-то и дело, что нет у меня окошка для выбора набора! с другими шрифтами есть, а
этом - нет. но и поменять шрифт нельзя - крякозябры вылезают. вот скриншот

a это http://www.columbia.edu/kermit/utf8-t1.html мне не поможет. т.к символы не соответствуют... :(

   
 
 автор: sim5   (07.11.2007 в 17:31)   письмо автору
 
   для: elenaki   (07.11.2007 в 16:32)
 

А что греческий как и китайский огромную кучу символов имеет? В Arial они что не помещаются все? Вот, например, для китайского, без добавления шрифта традиционного письма, некоторые иероглифы не отображаются. Ну неужели в "Греческом зале, в Греческом зале."... так много буковок?

   
 
 автор: elenaki   (07.11.2007 в 18:56)   письмо автору
 
   для: sim5   (07.11.2007 в 17:31)
 

у меня есть текст. он создан в программе Macromedia Director. для него специально был
создан шрифт, отображающий старо-греческий стиль письма. потом этот текст поместили
в документ Word и дали мне вместе со шрифтом для публикации на сайте. я не могу этот
текст скопировать. после вставки куда бы то ни было кроме другого документа Word он
отображается крякозябрами. изменить шрифт прямо в Worde я не могу - вылезают те же
зяблики. прикрутить свой шрифт к сайту не могу, испробовала много способов, ни один не
сработал. я вовсе не в восторге от того, что придется грузить шрифт вместе с сайтом.
гораздо лучше было бы, если б удалось поменять кодировку, а с ней и шрифт у исходного
текста, тем более, что старо-греческий стиль поддерживается другими, более распростра-
ненными шрифтами. только я все равно не нашла нужных мне символов в таблице Unicode.
а те коды, которые я нашла, относились вовсе не к греческому...

   
 
 автор: sim5   (07.11.2007 в 19:29)   письмо автору
 
   для: elenaki   (07.11.2007 в 18:56)
 

Вот в чем дело. Пока этот шрифт не будет зарегистрирован в системе, никто его понимать не будет. А для регистрации нужно установить этот шрифт, или просто банально скопировать в папку Fonts системы.

   
 
 автор: elenaki   (07.11.2007 в 19:47)   письмо автору
 
   для: sim5   (07.11.2007 в 19:29)
 

даже после установки шрифта в систему нельзя вставить скопированный текст ни в Блокнот, ни в HomeSite, ни в WYSIWYG, который работает в браузере. удается вставка только в Дрим и то после настроек Preferences. вижу текст в коде, вижу текст в предпросмотре, но браузер выводит китайскую грамоту. кодировка в браузере utf-8, смена кодировки не помогает.

   
 
 автор: ddhvvn   (07.11.2007 в 19:48)   письмо автору
 
   для: elenaki   (07.11.2007 в 19:47)
 

Хм... Что-то я тоже запутался немного... А какая кодировка в самом редакторе?

   
 
 автор: elenaki   (07.11.2007 в 19:50)   письмо автору
 
   для: ddhvvn   (07.11.2007 в 19:48)
 

в Дриме я поставила "создавать html в utf-8". какая кодировка в самом редакторе - ХЗ. а какая кодировка в Ворде? а в буфере обмена?

   
 
 автор: ddhvvn   (07.11.2007 в 19:52)   письмо автору
 
   для: elenaki   (07.11.2007 в 19:50)
 

В буфере обмена такая, какая и в программе, из которой осуществлялось копирование :))

   
 
 автор: sim5   (07.11.2007 в 19:53)   письмо автору
 
   для: ddhvvn   (07.11.2007 в 19:52)
 

У Буфера обмена нет кодировки вообще никакой, Буфер обмена содержит данные в своем формате!

   
 
 автор: sim5   (07.11.2007 в 19:51)   письмо автору
 
   для: elenaki   (07.11.2007 в 19:47)
 

Верится с трудом. Знаю только одну программу, которая не верно отображает параметры шрифтов в системе, особенно кириллицу - это Фотошоп, а за Word не наблюдал такового. Можно "потрогать" ваш древнегреческий шрифт?

   
 
 автор: elenaki   (07.11.2007 в 20:01)   письмо автору
291.1 Кб
 
   для: sim5   (07.11.2007 в 19:51)
 

пожалуйста. только он не древнегреческий, а старогреческий. есть две системы письма - монотоническая и политоническая. обычно используется монотоническая, т.е. у каждого слова более 2-х слогов есть только одно ударение. а в старом стиле этих ударений (и придыханий) намного больше. даю вместе со страницей текста и шрифт.

   
 
 автор: sim5   (07.11.2007 в 20:06)   письмо автору
 
   для: elenaki   (07.11.2007 в 20:01)
 

Спасибо elenaki за доп. разъяснение, теперь, думаю, сегодня к обеду я свободно буду изъясняться на политоническом старогреческом. )) Сейчас просто попробую копирование и вставку.

   
 
 автор: sim5   (07.11.2007 в 20:17)   письмо автору
 
   для: elenaki   (07.11.2007 в 20:01)
 

До установки шрифта вижу в Word вместо некоторых символов квадратики. Устанавливаю шрифты - в Word все нормально. Копирую в Блокнот - квадратики, но если в блокноте выбрать шрифт (название его видно в Word), то все нормально. Результат прикрепляю. Думаю, если вставить в HTML и указать нужный шрифт, то и в нем проблем не будут.

   
 
 автор: elenaki   (07.11.2007 в 20:22)   письмо автору
 
   для: sim5   (07.11.2007 в 20:17)
 

> если вставить в HTML и указать нужный шрифт
указать - где? говорю же, я вставляла и в HomeSite и в DreamWeaver. HomeSite выводит абракадабру, Дриму если сказать, что тексты выводить тем шрифтом, выводит, но в браузере все равно ерунда!

   
 
 автор: sim5   (07.11.2007 в 20:36)   письмо автору
 
   для: elenaki   (07.11.2007 в 20:22)
 

Вставил в HomeSite - в теге FONT выбрал из списка шрифт MgPolTimesM, отображает но есть символы не такие как в Ворде, не много, но есть. Значит не правильно, на сколько я могу судить, исходя из своих знаний древнегреческого. )) Может быть другой древнегреческий для HTML попробовать.

   
 
 автор: elenaki   (07.11.2007 в 20:46)   письмо автору
 
   для: sim5   (07.11.2007 в 20:36)
 

в HomeSite показывает текст только в коде и то, если выбрать в настройках шрифт по имени и еще внизу Symbol. но в браузер выводится абракадабра. ни utf-8 ни какая другая кодировка не спасает.

   
 
 автор: sim5   (07.11.2007 в 20:52)   письмо автору
 
   для: elenaki   (07.11.2007 в 20:46)
 

Прикрепляю html версию вашего файла, сохраненного Вордом, посмотрите, как гречанка - вроде все правильно. Кодировку выбрал греческую - windows-1253.

   
 
 автор: elenaki   (07.11.2007 в 21:07)   письмо автору
 
   для: sim5   (07.11.2007 в 20:52)
 

на компе, где шрифт не установлен, вижу крякозябры. на другом - нормальный текст. судя по заголовкам, он сохранен из Ворда как html. у меня на работе не Ворд, а Writer из OpenOffice и он неправильно сохранял как html. после копирования текста из браузера и вставки в WYSIWYG текст вставился (на работе не вставлялся), но в коде присутствует ссылка на font-family, т.е. на компе клиента, где нет такого шрифта, ничего путного не вылезет. при попытке замены шрифта в WYSIWYG - опять абракадабра. при попытке замены шрифта в самом Ворде (после вставки туда скопированного из браузера текста) - абракадабра. т.е остается только один путь - прикручивать шрифт к сайту.

   
 
 автор: kasmanaft   (08.11.2007 в 05:42)   письмо автору
 
   для: elenaki   (07.11.2007 в 21:07)
 

Просто изменить шрифт, я думаю, не получится.. Смотрите: Arial Unicode MS поддерживает старогреческий? Если поменять шрифт на него, все равно пустые квадратики показываются.. Если не поддерживает - оно понятно, а вот если поддерживает - значит у него с вашим шрифтом расходятся символьные таблицы (или как их там?). То есть буквы друг другу не соответствуют между шрифтами.
Может быть проще будет перенабрать текст? Или там напечатать, посканировать, распознать...

   
 
 автор: sim5   (08.11.2007 в 05:43)   письмо автору
 
   для: elenaki   (07.11.2007 в 21:07)
 

Насколько я знаю, прикрутить можно только для IE. В том, что я сохранил в HTML формате из Word, шрифт конечно же не сохраняется, если я его удалю из системы, то по идее, будет взят другой шрифт, если конечно указать семейство шрифтов. Кстати о вставке в HomeSite. Непосредсвенно вставка через буфер обмена из Word в HomeSite приводит к тому, что некоторые сиволы вставляются не верно, а при записи как HTML, Word расставил все верно, например этот &acute; или &#149;. HomeSite еще и русский корежит при вставке/копировании.

   
 
 автор: elenaki   (08.11.2007 в 10:24)   письмо автору
 
   для: sim5   (08.11.2007 в 05:43)
 

сейчас попробовала еще раз на работе.
1. устанавливаю шрифт
2. в OpenOffice выбираю этот шрифт, сохраняю страницу как html
3. в программе ( OpenOffice) текст виден, в браузере - нет
4. лезу в код, стоит по умолчанию кодировка utf8 и Times New Roman
5. меняю шрифт в HomeSite - ничего не помогает
6. иду в Дрим меняю кодировку на utf-8, вижу текст в предпросмотре
7. иду в браузер, вижу вопросительные знаки вместо текста

вывод: OpenOffice - жалкое подобие Word'a и не делает и половины того, что делает Word.

перенабирать текст многовато будет, там около 200 страниц. наверно, легче будет
сделать скриншоты и прочитать их FineReader'om, сохранив в Word'e с другим шрифтом.

   
 
 автор: AlexSol   (08.11.2007 в 10:37)   письмо автору
 
   для: elenaki   (08.11.2007 в 10:24)
 

предлагаю зашить текст в флешку и сделать в ней текстовое поле.

   
 
 автор: sim5   (08.11.2007 в 10:41)   письмо автору
 
   для: elenaki   (08.11.2007 в 10:24)
 

elenaki, предлагаю кардинальное решение проблемы - возвращайтесь в Россию, и проблемы с древнегреческим отпадут сами собой. ))

   
 
 автор: elenaki   (08.11.2007 в 10:59)   письмо автору
 
   для: sim5   (08.11.2007 в 10:41)
 

в 2002 году писано, а воз и ныне там...
http://www.compuart.ru/article.aspx?id=9125&iid=383

флаш не подходит, статьи предназначены для CMS.

вариант с возвращением не рассматривается :)

   
 
 автор: AlexSol   (08.11.2007 в 11:13)   письмо автору
 
   для: elenaki   (08.11.2007 в 10:59)
 

показывать нестандартные шрифты на стороне пользователя умеет только флешь.

   
 
 автор: Eugene77   (08.11.2007 в 17:12)   письмо автору
 
   для: AlexSol   (08.11.2007 в 11:13)
 

А может сделать из нестандартных букв смайлики и
вставлять их без всякой флеши.

   
 
 автор: elenaki   (08.11.2007 в 18:42)   письмо автору
 
   для: AlexSol   (08.11.2007 в 11:13)
 

не только Флэш. это видно из статьи по ссылке вверху. просто мороки много - искать
программы, скачивать, устанавливать, переделывать шрифты, подключать шрифты,
удалять шрифты, тестировать... мне разрешили использовать на сайте другой шрифт,
поддерживающий unicode. а текст они сами переконевертируют в другую кодировку.
вся проблема была из-за этого самопального шрифта, в нем коды символов не соответ-
ствовали юникоду. и еще не факт, что из этого шрифта удалось бы создать файл его
описания для подключения на сайте, как описано в той статье.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования