|
Внимание, важное сообщение: Дорогие Друзья!
В ноябре далекого 2001 года мы решили создать сайт и форум, которые смогут помочь как начинающим, так и продвинутым пользователям разобраться в операционных системах. В 2004-2006г наш проект был одним из самых крупных ИТ ресурсов в рунете, на пике нас посещало более 300 000 человек в день! Наша документация по службам Windows и автоматической установке помогла огромному количеству пользователей и сисадминов. Мы с уверенностью можем сказать, что внесли большой вклад в развитие ИТ сообщества рунета. Но... время меняются, приоритеты тоже. И, к сожалению, пришло время сказать До встречи! После долгих дискуссий было принято решение закрыть наш проект. 1 августа форум переводится в режим Только чтение, а в начале сентября мы переведем рубильник в положение Выключен Огромное спасибо за эти 24 года, это было незабываемое приключение. Сказать спасибо и поделиться своей историей можно в данной теме. С уважением, ваш призрачный админ, BigMac... |
|
| Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Debian/Ubuntu - Перекодировать файл с двумя кодировками |
|
|
Debian/Ubuntu - Перекодировать файл с двумя кодировками
|
|
Старожил Сообщения: 150 |
Добрый день!
Есть файл лога от базы данных, лог этот пишется в двух кодировках, UTF-8 и CP1251. В итоге на Debian 9 сообщения которые записаны в CP1251 не читабельны. Пытаюсь конвертировать его в кодировку UTF-8, но безрезультатно - на выходе снова кракозябры, но уже другие. Утилита enca определяет этот файл ISO 8859-5 standard; ISO Cyrillic Пытался такими способами: iconv -f ISO8859-5 pg.log -t UTF-8 -o out.log enconv -L russian -x UTF-8 pg.log Все равно остаются кракозябры. Относительно успешно было в виндовом Notepad++, там если менять кодировку я вижу часть сообщений в CP1251, а часть в UTF-8. Как "приравнять" файл к одной кодировке? Заранее спасибо. Файл с примером лога приложил. |
|
|
Отправлено: 15:38, 24-03-2023 |
|
fascinating rhythm Сообщения: 6702
|
Профиль | Отправить PM | Цитировать from='/home/user/pg.log'
to='/home/user/pg-new.log'
while read p; do
if echo "$p" |grep -q --binary-files=text -v '[а-я]'; then
echo "$p" |iconv -f WINDOWS-1251 -t UTF-8 >> $to
else
echo "$p" >> $to
fi
done <$from
https://stackoverflow.com/questions/...a-file-in-bash https://unix.stackexchange.com/quest...native-methods |
|
------- Последний раз редактировалось DJ Mogarych, 24-03-2023 в 16:32. Причина: универсальное решение Отправлено: 15:55, 24-03-2023 | #2 |
|
Старожил Сообщения: 150
|
Профиль | Отправить PM | Цитировать DJ Mogarych, спасибо, попробую.
|
|
Отправлено: 16:45, 24-03-2023 | #3 |
|
|
Участник сейчас на форуме |
|
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
| Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
| Анонсирован смартфон LG V10 с двумя дисплеями и двумя передними камерами | OSZone News | Новости железа | 0 | 01-10-2015 19:30 | |
| CMD/BAT - Помогите разобраться с кодировками в BAT | qter | Скриптовые языки администрирования Windows | 4 | 29-10-2012 00:30 | |
| CMD/BAT - Проблема с кодировками в cmd. | zvezduk | Скриптовые языки администрирования Windows | 15 | 08-02-2009 13:15 | |
| Delphi - Delphi 7, проблема с кодировками | drGreen | Программирование и базы данных | 2 | 12-03-2004 02:51 | |
| Редактор с разными кодировками | ualin | Общий по Linux | 9 | 15-04-2003 05:04 | |
|