1
|
<header>Ajuda de les Definicions de Serveis de MON</header>
|
2
|
|
3
|
<p>Aquest ?s el segon i ?ltim pas de la configuraci? de MON.
|
4
|
<p>Els valors per defecte dels Serveis obligatoris es mostren
|
5
|
<marcats amb vermell>. Mira el tema d'ajuda corresponent per a m?s
|
6
|
informaci? sobre les Definicions de Serveis.
|
7
|
<p>Per a <b>"mail.alert"</b>, assegura't que sendmail est? configurat
|
8
|
i el dimoni <b>"sendmail"</b> est? en execuci? a la m?quina hoste.
|
9
|
|
10
|
<H3>Definicions de Servei</H3>
|
11
|
<P>
|
12
|
<DL COMPACT>
|
13
|
|
14
|
<DT><B>service</B><I> nom</I>
|
15
|
<DD>
|
16
|
La definici? d'un servei comen?a amb la paraula clau
|
17
|
<B>service</B>
|
18
|
seguida d'una paraula que ?s l'etiqueta d'aquest servei.
|
19
|
<P>
|
20
|
Els components d'un servei s?n un interval, monitor i un o m?s
|
21
|
per?odes de temps, tal i com es defineix m?s avall.
|
22
|
<P>
|
23
|
Si es defineix un nom de servei "default" dins d'un
|
24
|
grup d'observaci? anomenat "default" (vegeu m?s amunt),
|
25
|
llavors la definici? default/default s'utilitzar? per a manipular
|
26
|
trampes desconegudes de mon.
|
27
|
<P>
|
28
|
|
29
|
<DT><B>interval</B><I> temps</I>
|
30
|
<DD>
|
31
|
La paraula clau
|
32
|
<B>interval</B>
|
33
|
seguida d'un valor de temps especifica la freq??ncia amb qu? es dispara
|
34
|
un script de monitoritzaci?.
|
35
|
|
36
|
Els valors de temps es defineixen com a "30s", "5m",
|
37
|
"1h", o "1d", que vol dir 30 segons, 1 hora o 1 dia.
|
38
|
La part num?rica pot ser una fracci?, com ara "1.5h" o b? una
|
39
|
hora i mitja. Aquest format d'una especificaci? de temps ser? referida
|
40
|
com a <I>temps</I>.
|
41
|
<P>
|
42
|
|
43
|
<DT><B>traptimeout</B><I> temps</I>
|
44
|
<DD>
|
45
|
Aquesta paraula clau pren el mateix argument d'especificaci? de temps
|
46
|
que <B>interval</B><I>,</I> i fa que el servei esperi una desviaci? d'una
|
47
|
font exterior al menys amb aquest freq??ncia, altrament s'enregistrar?
|
48
|
una fallada. Aix? s'utilitza per a serveis de l'estil de <i>hearbeat</i>.
|
49
|
<P>
|
50
|
|
51
|
<DT><B>trapduration</B><I> temps</I>
|
52
|
<DD>
|
53
|
Si es rep una desviaci?, l'estat del servei al qual s'ha lliurat la desviaci?,
|
54
|
romandr? normalment constant. Si s'especifica <B>trapduration</B>, l'estat
|
55
|
del servei romandr? en estat de fallada durant el temps especificat per
|
56
|
<I>temps</I>, i llavors es restaurar? a "operatiu".
|
57
|
<P>
|
58
|
|
59
|
<DT><B>randskew</B><I> temps</I>
|
60
|
<DD>
|
61
|
Ajusta de forma aleat?ria l'interval especificat pel par?metre
|
62
|
<B>interval</B> amb m?s/menys <B>randskew</B>, m?s que no pas fer
|
63
|
que el script de monitoritzaci? s'executi al principi de cada interval.
|
64
|
|
65
|
El valor de trasllat s'especifica igual que el par?metre <B>interval</B>:
|
66
|
"30s", "5m", etc...
|
67
|
Per exemple, si <B>interval</B> ?s 1m i <B>randskew</B> ?s
|
68
|
"5s", llavors <I>mon</I> programar? el script de monitoritzaci?
|
69
|
a un temps d'entre 55 segons i 65 segons. La intenci? ?s ajudar a distibuir
|
70
|
la c?rrega del servidor quan hi ha molts serveis programats als mateixos
|
71
|
intervals.
|
72
|
<P>
|
73
|
|
74
|
<DT><B>monitor</B><I> nom [arg...]</I>
|
75
|
<DD>
|
76
|
La paraula clau <B>monitor</B> seguida d'un nom de script i uns arguments
|
77
|
especifica el monitor que s'ha d'executar quan expira el cron?metre.
|
78
|
Quan s'especifiquen els arguments a enviar al script de monitoritzaci?,
|
79
|
se segueixen les convencions tipus shell per a les cometes. El script
|
80
|
s'invoca des del directori donat amb l'argument <B>-s</B>, i totes les
|
81
|
paraules seg?ents es passen com a argument al programa de monitoritzaci?,
|
82
|
seguides de la llista de hosts del grup referit pel grup d'observaci?
|
83
|
actual. Si la l?nia del monitor acaba amb ";;" com una paraula
|
84
|
separada, llavors no s'afegeixen els grups de hosts a la llista d'arguments
|
85
|
quan s'invoca el programa.
|
86
|
<P>
|
87
|
|
88
|
<DT><B>allow_empty_group</B>
|
89
|
<DD>
|
90
|
L'opci? <B>allow_empty_group</B> permetr? que s'invoqui un monitor fins i tot
|
91
|
quan el grup de hosts d'aquest observaci? estigui buit a causa dels hosts
|
92
|
desactivats. La conducta per defecte ?s no invocar el monitor quan tots els
|
93
|
hosts d'un grup han estat desactivats.
|
94
|
<P>
|
95
|
|
96
|
<DT><B>description</B><I> descripci?</I>
|
97
|
<DD>
|
98
|
El text que segueix a <B>description</B> ?s analitzat pels programes client
|
99
|
i passat a avisos i monitors a trav?s d'una variable d'entorn. Hauria de
|
100
|
contenir una descripci? breu del servei, apropiada per a incloure en un
|
101
|
correu electr?nic o una p?gina web.
|
102
|
<P>
|
103
|
|
104
|
<DT><B>exclude_hosts</B><I> host [host...]</I>
|
105
|
<DD>
|
106
|
Tots els hosts llistats despr?s de <B>exclude_hosts</B> seran exclosos
|
107
|
de la comprovaci? del servei.
|
108
|
<P>
|
109
|
|
110
|
<DT><B>exclude_period</B><I> per?ode</I>
|
111
|
<DD>
|
112
|
No executar un monitor programat durant el temps identificat per <I>per?ode</I>.
|
113
|
<P>
|
114
|
|
115
|
<DT><B>depend</B><I> expressi?</I>
|
116
|
<DD>
|
117
|
La paraula clau <B>depend</B> s'utilitza per especificar una expressi? de
|
118
|
depend?ncia que s'avalua a veritat o fals, en el sentit boole?. Les
|
119
|
depend?ncies s?n, de fet, expressions Perl, i n'han d'obeir totes les
|
120
|
regles sint?ctiques. Les expressions s'avaluen en l'espai del seu propi
|
121
|
paquet, per evitar efectes secundaris no desitjats. Si es troba un error
|
122
|
de sintaxi en avaluar l'expressi?, s'enregistra a trav?s de syslog.
|
123
|
<P>
|
124
|
Abans de l'avaluaci?, s'efectuen les seg?ents substitucions a l'expressi?:
|
125
|
les frases del tipus "group:service" se substitueixen amb el valor
|
126
|
de l'estat actual d'operaci? del servei especificat. Aquestes substitucions
|
127
|
de l'estat d'operaci? es calculen de forma recursiva, de manera que si el
|
128
|
servei a dep?n del servei B, i el servei B dep?n del servei C, llavors el
|
129
|
servei A dep?n del servei C. Els estats d'operaci? correctes (que s'avaluen
|
130
|
a "1") s?n "STAT_OK", "STAT_COLDSTART",
|
131
|
"STAT_WARMSTART", i "STAT_UNKNOWN". Es pot utilitzar
|
132
|
la paraula "SELF" (tot en maj?scules) per al grup (p. ex.,
|
133
|
"SELF:service"), i ?s un abreujament del grup d'observaci? actual.
|
134
|
<P>
|
135
|
Aquesta caracter?stica es pot utilitzar per controlar els avisos dels
|
136
|
serveis que depenen d'altres serveis. p. ex., una prova SMTP que dep?n
|
137
|
de la m?quina a la qual es fa ping.
|
138
|
<P>
|
139
|
|
140
|
<DT><B>dep_behavior</B><I> {a|m}</I>
|
141
|
<DD>
|
142
|
L'avaluaci? dels grafs de depend?ncia pot controlar la supressi? d'avisos
|
143
|
o b? d'invocacions del monitor.
|
144
|
<P>
|
145
|
<B>Supressi? d'av?s</B>.
|
146
|
Si s'estableix aquesta opci? a "a", llavors l'expressi? de
|
147
|
depend?ncia s'avaluar? despr?s que s'executi el monitor d'aquest servei
|
148
|
o despr?s de rebre una desviaci?. Nom?s s'enviar? un av?s si l'avaluaci?
|
149
|
re?x, volent dir que cap dels nodes del graf de depend?ncia indica fallada.
|
150
|
<P>
|
151
|
<B>Supressi? de monitor</B>.
|
152
|
Si s'estableix a "m", llavors l'expressi? de depend?ncia
|
153
|
s'avaluar? abans que s'executi el monitor d'aquest servei. Si l'avaluaci?
|
154
|
re?x, llavors el monitor s'executar?. Altrament, el monitor no s'executar?
|
155
|
i l'estat del servei romandr? igual.
|
156
|
<P>
|
157
|
</DL>
|
158
|
|
159
|
<A NAME="lbAO"> </A>
|
160
|
<H3>Definicions de Per?ode</H3>
|
161
|
|
162
|
<P>
|
163
|
Els per?odes s'utilitzen per definir les condicions que han de permetre
|
164
|
el lliurament dels avisos.
|
165
|
<P>
|
166
|
<DL COMPACT>
|
167
|
|
168
|
<DT><B>period</B><I> [etiqueta:] per?ode</I>
|
169
|
<DD>
|
170
|
Un per?ode agrupa un o m?s avisos i variables que controlen amb quina
|
171
|
freq??ncia se succeeix un av?s quan hi ha una fallada.
|
172
|
La paraula clau <B>period</B> t? dues formes. La primera pren un argument
|
173
|
que ?s una especificaci? de per?ode del m?dul Perl Time::Period de Patrick
|
174
|
Ryan. Vegeu "perldoc Time::Period" per a m?s informaci?.
|
175
|
<P>
|
176
|
La segona forma necessita una etiqueta seguida d'una especificaci? de
|
177
|
per?ode, tal i com es defineix abans. L'etiqueta ?s un car?cter alfab?tic
|
178
|
o subgui? (_) seguit de zero o m?s car?cters alfanum?rics o subguions i
|
179
|
acabada amb dos punts (:). Aquesta forma permet per?odes m?ltiples amb
|
180
|
la mateixa definici? de per?ode. Un ?s ?s tenir una definici? de per?ode
|
181
|
que no t? cap par?metre <B>alertafter</B> ni <B>alertevery</B> per a un
|
182
|
per?ode de temps particular, i un altre per al mateix per?ode de temps
|
183
|
amb un conjunt d'avisos diferents que s? contenen aquests par?metres.
|
184
|
<P>
|
185
|
|
186
|
<DT><B>alertevery</B><I> temps</I>
|
187
|
<DD>
|
188
|
La paraula clau <B>alertevery</B> (en una definici? <B>period</B>)
|
189
|
pren el mateix tipus d'arguments que la variable <B>interval</B>,
|
190
|
i limita el nombre de vegades que s'envia un av?s quan el servei
|
191
|
segueix fallant. Per exemple, si l'interval ?s "1h", llavors
|
192
|
nom?s els avisos de la secci? del per?ode s'enviaran cada hora.
|
193
|
Si en una entrada de per?ode s'omet la paraula clau <B>alertevery</B>,
|
194
|
s'enviar? un av?s cada cop que es detecti una fallada. Per defecte,
|
195
|
si canvia la sortida de dues fallades successives, llavors s'ignora
|
196
|
l'interval <b>alertevery</b>.
|
197
|
Si el darrer argument ?s la paraula "summary", llavors nom?s
|
198
|
es tindran en compte les l?nies de sortida del resum en comparar la
|
199
|
sortida de les successives fallades.
|
200
|
<P>
|
201
|
|
202
|
<DT><B>alertafter</B><I> n?m</I>
|
203
|
<DD>
|
204
|
<P>
|
205
|
|
206
|
<DT><B>alertafter</B><I> n?m temps</I>
|
207
|
<DD>
|
208
|
La paraula clau <B>alertafter</B> (en una secci? <B>period</B>) t? dues
|
209
|
formes: nom?s amb l'argument "n?m", o amb els arguments
|
210
|
"n?m temps". Amb la primera forma, nom?s s'invocar? un av?s
|
211
|
despr?s de "n?m" fallades consecutives.
|
212
|
<P>
|
213
|
Amb la segona forma, els arguments s?n un enter positiu seguit d'un interval,
|
214
|
tal i com es descriu a la variable <B>interval</B> m?s amunt.
|
215
|
Si s'especifiquen aquests par?metres, llavors els avisos d'aquest per?ode
|
216
|
nom?s es cridaran despr?s que s'esdevingui aquest nombre de fallades en
|
217
|
aquest interval. Per exemple, si es donen a <B>alertafter</B> els arguments
|
218
|
"3 30m", llavors l'av?s es cridar? si se succeeixen 3
|
219
|
fallades en 30 minuts.
|
220
|
<P>
|
221
|
|
222
|
<DT><B>numalerts</B> <I>n?m</I>
|
223
|
<DD>
|
224
|
<P>
|
225
|
Aquesta variable diu al servidor que no cridi m?s de <I>n?m</I> avisos
|
226
|
durant una fallada. El comptador d'avisos es mant? en base al per?ode,
|
227
|
i es reinicia despr?s de cada pas a operatiu.
|
228
|
<P>
|
229
|
|
230
|
<DT><B>comp_alerts</B>
|
231
|
<DD>
|
232
|
<P>
|
233
|
Si s'especifica aquesta opci?, llavors nom?s es cridaran els avisos
|
234
|
<b>upalert</b> si s'ha cridat l'av?s "down" corresponent.
|
235
|
<P>
|
236
|
|
237
|
<DT><B>alert</B><I> av?s [arg...]</I>
|
238
|
<DD>
|
239
|
Un per?ode pot contenir m?ltiples avisos, que es disparen en cas de
|
240
|
fallada del servei. Un av?s s'especifica amb la paraula clau
|
241
|
<B>alert</B>, seguida d'un par?metre <B>exit</B> opcional, i els
|
242
|
arguments que s'interpreten igual que la definici? <B>monitor</B>,
|
243
|
per? sense l'excepci? ";;". El par?metre <B>exit</B>
|
244
|
pren la forma <B>exit=x</B> o <B>exit=x-y</B> i per efecte que
|
245
|
l'av?s nom?s es cridi si l'estat de sortida del script de monitoritzaci?
|
246
|
?s dins del rang del par?metre <B>exit</B>. Si, per exemple, la l?nia
|
247
|
d'av?s ?s <I>alert exit=10-20 mail.alert mis</I>, llavors
|
248
|
<I>mail-alert</I> nom?s s'invocar? amb <I>mis</I> com a arguments
|
249
|
si el valor de retorn del programa monitor est? entre 10 i 20.
|
250
|
Aquesta caracter?stica permet disparar avisos diferents en diferents
|
251
|
nivells de severitat (com ara quan l'espai lliure del disc passa del
|
252
|
8% al 3%).
|
253
|
<P>
|
254
|
Vegeu la secci? <B>PROGRAMES D'AV?S</B> m?s amunt per a una llista de
|
255
|
par?metres que mon passar? autom?ticament als programes d'av?s.
|
256
|
<P>
|
257
|
|
258
|
<DT><B>upalert</B><I> av?s [arg...]</I>
|
259
|
<DD>
|
260
|
<B>upalert</B> ?s el complement de <B>alert</B>.
|
261
|
Es crida quan un servei fa la transici? d'estat de fallada a operatiu.
|
262
|
El script <B>upalert</B> es crida subministrant els mateixos par?metres
|
263
|
que el script <B>alert</B>, amb l'addici? del par?metre <B>-u</B>,
|
264
|
que s'utilitza per deixar que un script d'av?s s?piga que
|
265
|
est? essent cridat com a <B>upalert</B>. Es poden especificar avisos
|
266
|
m?ltiples per a cada definici? de per?ode. Tingues en compte que la
|
267
|
conducta per defecte ?s que s'envi? un av?s <B>upalert</B> independentment
|
268
|
de si s'han enviat abans avisos "down", ja que "down"
|
269
|
es dispara durant una transici? d'estat. Estableix l'opci? d'avisos per
|
270
|
per?ode <B>comp_alerts</B> per aparellar els avisos <B>upalert</B> amb
|
271
|
els avisos "down".
|
272
|
<P>
|
273
|
|
274
|
<DT><B>startupalert</B><I> av?s [arg...]</I>
|
275
|
<DD>
|
276
|
<B>startupalert</B> nom?s es crida quan el servidior <B>mon</B> inicia
|
277
|
la seva execuci?.
|
278
|
<P>
|
279
|
|
280
|
<DT><B>upalertafter</B><I> temps</I>
|
281
|
<DD>
|
282
|
El par?metre <B>upalertafter</B> s'especifica com una cadena que segueix
|
283
|
la sintaxi del par?metre <B>interval</B> ("30s", "1m",
|
284
|
etc.), i controla l'execuci? de <B>upalert</B>.
|
285
|
Si un servei torna a estar operatiu despr?s de fallar durant un temps
|
286
|
m?s gran o igual que el valor d'aquesta opci?, llavors es cridar? un
|
287
|
<B>upalert</B>. Utilitza aquesta opci? per evitar que es cridi
|
288
|
un <B>upalert</B> a causa de "blips" (petits talls).
|
289
|
<P>
|
290
|
|