Project

General

Profile

Download (12 KB) Statistics
| Branch: | Revision:
1
<header>Ajuda de les Definicions de Serveis de MON</header>
2

    
3
<p>Aquest ?s el segon i ?ltim pas de la configuraci? de MON.
4
<p>Els valors per defecte dels Serveis obligatoris es mostren
5
<marcats amb vermell>. Mira el tema d'ajuda corresponent per a m?s
6
informaci? sobre les Definicions de Serveis.
7
<p>Per a <b>"mail.alert"</b>, assegura't que sendmail est? configurat
8
i el dimoni <b>"sendmail"</b> est? en execuci? a la m?quina hoste.
9

    
10
<H3>Definicions de Servei</H3>
11
<P>
12
<DL COMPACT>
13

    
14
<DT><B>service</B><I> nom</I>
15
<DD>
16
La definici? d'un servei comen?a amb la paraula clau
17
<B>service</B>
18
seguida d'una paraula que ?s l'etiqueta d'aquest servei.
19
<P>
20
Els components d'un servei s?n un interval, monitor i un o m?s
21
per?odes de temps, tal i com es defineix m?s avall.
22
<P>
23
Si es defineix un nom de servei &quot;default&quot;  dins d'un
24
grup d'observaci? anomenat &quot;default&quot; (vegeu m?s amunt),
25
llavors la definici? default/default s'utilitzar? per a manipular
26
trampes desconegudes de mon.
27
<P>
28

    
29
<DT><B>interval</B><I> temps</I>
30
<DD>
31
La paraula clau
32
<B>interval</B>
33
seguida d'un valor de temps especifica la freq??ncia amb qu? es dispara
34
un script de monitoritzaci?.
35

    
36
Els valors de temps es defineixen com a &quot;30s&quot;, &quot;5m&quot;,
37
&quot;1h&quot;, o &quot;1d&quot;, que vol dir 30 segons, 1 hora o 1 dia.
38
La part num?rica pot ser una fracci?, com ara &quot;1.5h&quot; o b? una
39
hora i mitja. Aquest format d'una especificaci? de temps ser? referida
40
com a <I>temps</I>.
41
<P>
42

    
43
<DT><B>traptimeout</B><I> temps</I>
44
<DD>
45
Aquesta paraula clau pren el mateix argument d'especificaci? de temps
46
que <B>interval</B><I>,</I> i fa que el servei esperi una desviaci? d'una
47
font exterior al menys amb aquest freq??ncia, altrament s'enregistrar?
48
una fallada. Aix? s'utilitza per a serveis de l'estil de <i>hearbeat</i>.
49
<P>
50

    
51
<DT><B>trapduration</B><I> temps</I>
52
<DD>
53
Si es rep una desviaci?, l'estat del servei al qual s'ha lliurat la desviaci?,
54
romandr? normalment constant. Si s'especifica <B>trapduration</B>, l'estat
55
del servei romandr? en estat de fallada durant el temps especificat per
56
<I>temps</I>, i llavors es restaurar? a &quot;operatiu&quot;.
57
<P>
58

    
59
<DT><B>randskew</B><I> temps</I>
60
<DD>
61
Ajusta de forma aleat?ria l'interval especificat pel par?metre
62
<B>interval</B> amb m?s/menys <B>randskew</B>, m?s que no pas fer
63
que el script de monitoritzaci? s'executi al principi de cada interval.
64

    
65
El valor de trasllat s'especifica igual que el par?metre <B>interval</B>:
66
&quot;30s&quot;, &quot;5m&quot;, etc...
67
Per exemple, si <B>interval</B> ?s 1m i <B>randskew</B> ?s
68
&quot;5s&quot;, llavors <I>mon</I> programar? el script de monitoritzaci?
69
a un temps d'entre 55 segons i 65 segons. La intenci? ?s ajudar a distibuir
70
la c?rrega del servidor quan hi ha molts serveis programats als mateixos
71
intervals.
72
<P>
73

    
74
<DT><B>monitor</B><I> nom [arg...]</I>
75
<DD>
76
La paraula clau <B>monitor</B> seguida d'un nom de script i uns arguments
77
especifica el monitor que s'ha d'executar quan expira el cron?metre.
78
Quan s'especifiquen els arguments a enviar al script de monitoritzaci?,
79
se segueixen les convencions tipus shell per a les cometes. El script
80
s'invoca des del directori donat amb l'argument <B>-s</B>, i totes les
81
paraules seg?ents es passen com a argument al programa de monitoritzaci?,
82
seguides de la llista de hosts del grup referit pel grup d'observaci?
83
actual. Si la l?nia del monitor acaba amb &quot;;;&quot; com una paraula
84
separada, llavors no s'afegeixen els grups de hosts a la llista d'arguments
85
quan s'invoca el programa.
86
<P>
87

    
88
<DT><B>allow_empty_group</B>
89
<DD>
90
L'opci? <B>allow_empty_group</B> permetr? que s'invoqui un monitor fins i tot
91
quan el grup de hosts d'aquest observaci? estigui buit a causa dels hosts
92
desactivats. La conducta per defecte ?s no invocar el monitor quan tots els
93
hosts d'un grup han estat desactivats.
94
<P>
95

    
96
<DT><B>description</B><I> descripci?</I>
97
<DD>
98
El text que segueix a <B>description</B> ?s analitzat pels programes client
99
i passat a avisos i monitors a trav?s d'una variable d'entorn. Hauria de
100
contenir una descripci? breu del servei, apropiada per a incloure en un
101
correu electr?nic o una p?gina web.
102
<P>
103

    
104
<DT><B>exclude_hosts</B><I> host [host...]</I>
105
<DD>
106
Tots els hosts llistats despr?s de <B>exclude_hosts</B> seran exclosos 
107
de la comprovaci? del servei.
108
<P>
109

    
110
<DT><B>exclude_period</B><I> per?ode</I>
111
<DD>
112
No executar un monitor programat durant el temps identificat per <I>per?ode</I>.
113
<P>
114

    
115
<DT><B>depend</B><I> expressi?</I>
116
<DD>
117
La paraula clau <B>depend</B> s'utilitza per especificar una expressi? de
118
depend?ncia que s'avalua a veritat o fals, en el sentit boole?. Les 
119
depend?ncies s?n, de fet, expressions Perl, i n'han d'obeir totes les
120
regles sint?ctiques. Les expressions s'avaluen en l'espai del seu propi
121
paquet, per evitar efectes secundaris no desitjats. Si es troba un error
122
de sintaxi en avaluar l'expressi?, s'enregistra a trav?s de syslog.
123
<P>
124
Abans de l'avaluaci?, s'efectuen les seg?ents substitucions a l'expressi?:
125
les frases del tipus &quot;group:service&quot; se substitueixen amb el valor
126
de l'estat actual d'operaci? del servei especificat. Aquestes substitucions
127
de l'estat d'operaci? es calculen de forma recursiva, de manera que si el
128
servei a dep?n del servei B, i el servei B dep?n del servei C, llavors el
129
servei A dep?n del servei C. Els estats d'operaci? correctes (que s'avaluen
130
a &quot;1&quot;) s?n &quot;STAT_OK&quot;, &quot;STAT_COLDSTART&quot;, 
131
&quot;STAT_WARMSTART&quot;, i &quot;STAT_UNKNOWN&quot;. Es pot utilitzar
132
la paraula &quot;SELF&quot; (tot en maj?scules) per al grup (p. ex.,
133
&quot;SELF:service&quot;), i ?s un abreujament del grup d'observaci? actual.
134
<P>
135
Aquesta caracter?stica es pot utilitzar per controlar els avisos dels
136
serveis que depenen d'altres serveis. p. ex., una prova SMTP que dep?n
137
de la m?quina a la qual es fa ping.
138
<P>
139

    
140
<DT><B>dep_behavior</B><I> {a|m}</I>
141
<DD>
142
L'avaluaci? dels grafs de depend?ncia pot controlar la supressi? d'avisos
143
o b? d'invocacions del monitor.
144
<P>
145
<B>Supressi? d'av?s</B>.
146
Si s'estableix aquesta opci? a &quot;a&quot;, llavors l'expressi? de
147
depend?ncia s'avaluar? despr?s que s'executi el monitor d'aquest servei
148
o despr?s de rebre una desviaci?. Nom?s s'enviar? un av?s si l'avaluaci?
149
re?x, volent dir que cap dels nodes del graf de depend?ncia indica fallada.
150
<P>
151
<B>Supressi? de monitor</B>.
152
Si s'estableix a &quot;m&quot;, llavors l'expressi? de depend?ncia 
153
s'avaluar? abans que s'executi el monitor d'aquest servei. Si l'avaluaci?
154
re?x, llavors el monitor s'executar?. Altrament, el monitor no s'executar?
155
i l'estat del servei romandr? igual.
156
<P>
157
</DL>
158

    
159
<A NAME="lbAO">&nbsp;</A>
160
<H3>Definicions de Per?ode</H3>
161

    
162
<P>
163
Els per?odes s'utilitzen per definir les condicions que han de permetre
164
el lliurament dels avisos.
165
<P>
166
<DL COMPACT>
167

    
168
<DT><B>period</B><I> [etiqueta:] per?ode</I>
169
<DD>
170
Un per?ode agrupa un o m?s avisos i variables que controlen amb quina 
171
freq??ncia se succeeix un av?s quan hi ha una fallada.
172
La paraula clau <B>period</B> t? dues formes. La primera pren un argument
173
que ?s una especificaci? de per?ode del m?dul Perl Time::Period de Patrick
174
Ryan. Vegeu &quot;perldoc Time::Period&quot; per a m?s informaci?.
175
<P>
176
La segona forma necessita una etiqueta seguida d'una especificaci? de
177
per?ode, tal i com es defineix abans. L'etiqueta ?s un car?cter alfab?tic
178
o subgui? (_) seguit de zero o m?s car?cters alfanum?rics o subguions i 
179
acabada amb dos punts (:). Aquesta forma permet per?odes m?ltiples amb
180
la mateixa definici? de per?ode. Un ?s ?s tenir una definici? de per?ode 
181
que no t? cap par?metre <B>alertafter</B> ni <B>alertevery</B> per a un
182
per?ode de temps particular, i un altre per al mateix per?ode de temps 
183
amb un conjunt d'avisos diferents que s? contenen aquests par?metres.
184
<P>
185

    
186
<DT><B>alertevery</B><I> temps</I>
187
<DD>
188
La paraula clau <B>alertevery</B> (en una definici? <B>period</B>)
189
pren el mateix tipus d'arguments que la variable <B>interval</B>,
190
i limita el nombre de vegades que s'envia un av?s quan el servei
191
segueix fallant. Per exemple, si l'interval ?s &quot;1h&quot;, llavors
192
nom?s els avisos de la secci? del per?ode s'enviaran cada hora.
193
Si en una entrada de per?ode s'omet la paraula clau <B>alertevery</B>,
194
s'enviar? un av?s cada cop que es detecti una fallada. Per defecte, 
195
si canvia la sortida de dues fallades successives, llavors s'ignora
196
l'interval <b>alertevery</b>.
197
Si el darrer argument ?s la paraula &quot;summary&quot;, llavors nom?s
198
es tindran en compte les l?nies de sortida del resum en comparar la
199
sortida de les successives fallades.
200
<P>
201

    
202
<DT><B>alertafter</B><I> n?m</I>
203
<DD>
204
<P>
205

    
206
<DT><B>alertafter</B><I> n?m temps</I>
207
<DD>
208
La paraula clau <B>alertafter</B> (en una secci? <B>period</B>) t? dues
209
formes: nom?s amb l'argument &quot;n?m&quot;, o amb els arguments
210
&quot;n?m temps&quot;. Amb la primera forma, nom?s s'invocar? un av?s
211
despr?s de &quot;n?m&quot; fallades consecutives.
212
<P>
213
Amb la segona forma, els arguments s?n un enter positiu seguit d'un interval,
214
tal i com  es descriu a la variable <B>interval</B> m?s amunt.
215
Si s'especifiquen aquests par?metres, llavors els avisos d'aquest per?ode
216
nom?s es cridaran despr?s que s'esdevingui aquest nombre de fallades en
217
aquest interval. Per exemple, si es donen a <B>alertafter</B> els arguments
218
&quot;3&nbsp;30m&quot;, llavors l'av?s es cridar? si se succeeixen 3
219
fallades en 30 minuts.
220
<P>
221

    
222
<DT><B>numalerts</B> <I>n?m</I>
223
<DD>
224
<P>
225
Aquesta variable diu al servidor que no cridi m?s de <I>n?m</I> avisos
226
durant una fallada. El comptador d'avisos es mant? en base al per?ode,
227
i es reinicia despr?s de cada pas a operatiu.
228
<P>
229

    
230
<DT><B>comp_alerts</B>
231
<DD>
232
<P>
233
Si s'especifica aquesta opci?, llavors nom?s es cridaran els avisos
234
<b>upalert</b> si s'ha cridat l'av?s &quot;down&quot; corresponent.
235
<P>
236

    
237
<DT><B>alert</B><I> av?s [arg...]</I>
238
<DD>
239
Un per?ode pot contenir m?ltiples avisos, que es disparen en cas de 
240
fallada del servei. Un av?s s'especifica amb la paraula clau
241
<B>alert</B>, seguida d'un par?metre <B>exit</B> opcional, i els 
242
arguments que s'interpreten igual que la definici? <B>monitor</B>,
243
per? sense l'excepci? &quot;;;&quot;. El par?metre <B>exit</B>
244
pren la forma <B>exit=x</B> o <B>exit=x-y</B> i per efecte que 
245
l'av?s nom?s es cridi si l'estat de sortida del script de monitoritzaci?
246
?s dins del rang del par?metre <B>exit</B>. Si, per exemple, la l?nia 
247
d'av?s ?s <I>alert exit=10-20 mail.alert mis</I>, llavors
248
<I>mail-alert</I> nom?s s'invocar? amb <I>mis</I> com a arguments
249
si el valor de retorn del programa monitor est? entre 10 i 20.
250
Aquesta caracter?stica permet disparar avisos diferents en diferents
251
nivells de severitat (com ara quan l'espai lliure del disc passa del
252
8% al 3%).
253
<P>
254
Vegeu la secci? <B>PROGRAMES D'AV?S</B> m?s amunt per a una llista de
255
par?metres que mon passar? autom?ticament als programes d'av?s.
256
<P>
257

    
258
<DT><B>upalert</B><I> av?s [arg...]</I>
259
<DD>
260
<B>upalert</B> ?s el complement de <B>alert</B>.
261
Es crida quan un servei fa la transici? d'estat de fallada a operatiu.
262
El script <B>upalert</B> es crida subministrant els mateixos par?metres
263
que el script <B>alert</B>, amb l'addici? del par?metre <B>-u</B>,
264
que s'utilitza per deixar que un script d'av?s s?piga que
265
est? essent cridat com a <B>upalert</B>. Es poden especificar avisos
266
m?ltiples per a cada definici? de per?ode. Tingues en compte que la
267
conducta per defecte ?s que s'envi? un av?s <B>upalert</B> independentment
268
de si s'han enviat abans avisos &quot;down&quot;, ja que &quot;down&quot;
269
es dispara durant una transici? d'estat. Estableix l'opci? d'avisos per
270
per?ode <B>comp_alerts</B> per aparellar els avisos <B>upalert</B> amb
271
els avisos &quot;down&quot;.
272
<P>
273

    
274
<DT><B>startupalert</B><I> av?s [arg...]</I>
275
<DD>
276
<B>startupalert</B> nom?s es crida quan el servidior <B>mon</B> inicia
277
la seva execuci?.
278
<P>
279

    
280
<DT><B>upalertafter</B><I> temps</I>
281
<DD>
282
El par?metre <B>upalertafter</B> s'especifica com una cadena que segueix
283
la sintaxi del par?metre <B>interval</B> (&quot;30s&quot;, &quot;1m&quot;,
284
etc.), i controla l'execuci? de <B>upalert</B>.
285
Si un servei torna a estar operatiu despr?s de fallar durant un temps
286
m?s gran o igual que el valor d'aquesta opci?, llavors es cridar? un
287
<B>upalert</B>. Utilitza aquesta opci? per evitar que es cridi
288
un <B>upalert</B> a causa de  &quot;blips&quot; (petits talls).
289
<P>
290

    
(10-10/12)