ctdb-doc: Update ctdb man page
[samba.git] / ctdb / doc / ctdb.1.xml
1 <?xml version="1.0" encoding="iso-8859-1"?>
2 <!DOCTYPE refentry
3         PUBLIC "-//OASIS//DTD DocBook XML V4.5//EN"
4         "http://www.oasis-open.org/docbook/xml/4.5/docbookx.dtd">
5 <refentry id="ctdb.1">
6
7   <refentryinfo>
8     <author>
9       <contrib>
10         This documentation was written by
11         Ronnie Sahlberg,
12         Amitay Isaacs,
13         Martin Schwenke
14       </contrib>
15     </author>
16
17     <copyright>
18       <year>2007</year>
19       <holder>Andrew Tridgell</holder>
20       <holder>Ronnie Sahlberg</holder>
21     </copyright>
22     <legalnotice>
23       <para>
24         This program is free software; you can redistribute it and/or
25         modify it under the terms of the GNU General Public License as
26         published by the Free Software Foundation; either version 3 of
27         the License, or (at your option) any later version.
28       </para>
29       <para>
30         This program is distributed in the hope that it will be
31         useful, but WITHOUT ANY WARRANTY; without even the implied
32         warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR
33         PURPOSE.  See the GNU General Public License for more details.
34       </para>
35       <para>
36         You should have received a copy of the GNU General Public
37         License along with this program; if not, see
38         <ulink url="http://www.gnu.org/licenses"/>.
39       </para>
40     </legalnotice>
41   </refentryinfo>
42
43   <refmeta>
44     <refentrytitle>ctdb</refentrytitle>
45     <manvolnum>1</manvolnum>
46     <refmiscinfo class="source">ctdb</refmiscinfo>
47     <refmiscinfo class="manual">CTDB - clustered TDB database</refmiscinfo>
48   </refmeta>
49
50   <refnamediv>
51     <refname>ctdb</refname>
52     <refpurpose>CTDB management utility</refpurpose>
53   </refnamediv>
54
55   <refsynopsisdiv>
56     <cmdsynopsis>
57       <command>ctdb</command>
58       <arg rep="repeat"><replaceable>OPTION</replaceable></arg>
59       <arg choice="req"><replaceable>COMMAND</replaceable></arg>
60       <arg choice="opt"><replaceable>COMMAND-ARGS</replaceable></arg>
61     </cmdsynopsis>
62   </refsynopsisdiv>
63
64   <refsect1>
65     <title>DESCRIPTION</title>
66     <para>
67       ctdb is a utility to view and manage a CTDB cluster.
68     </para>
69
70     <para>
71       The following terms are used when referring to nodes in a
72       cluster:
73       <variablelist>
74         <varlistentry>
75           <term>PNN</term>
76           <listitem>
77             <para>
78               Physical Node Number.  The physical node number is an
79               integer that describes the node in the cluster. The
80               first node has physical node number 0.  in a cluster.
81             </para>
82           </listitem>
83         </varlistentry>
84         <varlistentry>
85           <term>PNN-LIST</term>
86           <listitem>
87             <para>
88               This is either a single PNN, a comma-separate list of PNNs
89               or "all".
90             </para>
91           </listitem>
92         </varlistentry>
93       </variablelist>
94     </para>
95
96     <para>
97       Commands that reference a database use the following terms:
98       <variablelist>
99         <varlistentry>
100           <term>DB</term>
101           <listitem>
102             <para>
103               This is either a database name, such as
104               <filename>locking.tdb</filename> or a database ID such
105               as "0x42fe72c5".
106             </para>
107           </listitem>
108         </varlistentry>
109         <varlistentry>
110           <term>DB-LIST</term>
111           <listitem>
112             <para>
113               A space separated list of at least one
114               <parameter>DB</parameter>.
115             </para>
116           </listitem>
117         </varlistentry>
118       </variablelist>
119     </para>
120   </refsect1>
121
122   <refsect1>
123     <title>OPTIONS</title>
124
125     <variablelist>
126       <varlistentry><term>-n <parameter>PNN-LIST</parameter></term>
127       <listitem>
128         <para>
129           The nodes specified by PNN-LIST should be queried for the
130           requested information.  Default is to query the daemon
131           running on the local host.
132         </para>
133       </listitem>
134       </varlistentry>
135
136       <varlistentry><term>-Y</term>
137       <listitem>
138         <para>
139           Produce output in machine readable form for easier parsing
140           by scripts. This uses a field delimiter of ':'.  Not all
141           commands support this option.
142         </para>
143       </listitem>
144       </varlistentry>
145
146       <varlistentry><term>-x <parameter>SEPARATOR</parameter></term>
147       <listitem>
148         <para>
149           Use SEPARATOR to delimit fields in machine readable output.
150           This implies -Y.
151         </para>
152       </listitem>
153       </varlistentry>
154
155       <varlistentry><term>-X</term>
156       <listitem>
157         <para>
158           Produce output in machine readable form for easier parsing
159           by scripts. This uses a field delimiter of '|'.  Not all
160           commands support this option.
161         </para>
162         <para>
163           This is equivalent to "-x|" and avoids some shell quoting
164           issues.
165         </para>
166       </listitem>
167       </varlistentry>
168
169       <varlistentry><term>-t <parameter>TIMEOUT</parameter></term>
170       <listitem>
171         <para>
172           Indicates that ctdb should wait up to TIMEOUT seconds for
173           a response to most commands sent to the CTDB daemon.  The
174           default is 10 seconds.
175         </para>
176       </listitem>
177       </varlistentry>
178
179       <varlistentry><term>-T <parameter>TIMELIMIT</parameter></term>
180       <listitem>
181         <para>
182           Indicates that TIMELIMIT is the maximum run time (in
183           seconds) for the ctdb command.  When TIMELIMIT is exceeded
184           the ctdb command will terminate with an error.  The default
185           is 120 seconds.
186         </para>
187       </listitem>
188       </varlistentry>
189
190       <varlistentry><term>-? --help</term>
191       <listitem>
192         <para>
193           Print some help text to the screen.
194         </para>
195       </listitem>
196       </varlistentry>
197
198       <varlistentry><term>--usage</term>
199       <listitem>
200         <para>
201           Print useage information to the screen.
202         </para>
203       </listitem>
204       </varlistentry>
205
206       <varlistentry><term>-d --debug=<parameter>DEBUGLEVEL</parameter></term>
207       <listitem>
208         <para>
209           Change the debug level for the command. Default is NOTICE (2).
210         </para>
211       </listitem>
212       </varlistentry>
213
214       <varlistentry><term>--socket=<parameter>FILENAME</parameter></term>
215       <listitem>
216         <para>
217           Specify that FILENAME is the name of the Unix domain
218           socket to use when connecting to the local CTDB
219           daemon. The default is
220           <filename>/usr/local/var/run/ctdb/ctdbd.socket</filename>.
221         </para>
222       </listitem>
223       </varlistentry>
224     </variablelist>
225   </refsect1>
226
227
228   <refsect1>
229     <title>ADMINISTRATIVE COMMANDS</title>
230     <para>
231       These are commands used to monitor and administer a CTDB cluster.
232     </para>
233
234     <refsect2>
235       <title>pnn</title>
236       <para>
237         This command displays the PNN of the current node.
238       </para>
239     </refsect2>
240
241     <refsect2>
242       <title>xpnn</title>
243       <para>
244         This command displays the PNN of the current node without
245         contacting the CTDB daemon.  It parses the nodes file
246         directly, so can produce unexpected output if the nodes file
247         has been edited but has not been reloaded.
248       </para>
249     </refsect2>
250
251     <refsect2>
252       <title>status</title>
253       <para>
254         This command shows the current status of all CTDB nodes based
255         on information from the queried node.
256       </para>
257
258       <para>
259         Note: If the the queried node is INACTIVE then the status
260         might not be current.
261       </para>
262
263       <refsect3>
264         <title>Node status</title>
265         <para>
266           This includes the number of physical nodes and the status of
267           each node.  See <citerefentry><refentrytitle>ctdb</refentrytitle>
268           <manvolnum>7</manvolnum></citerefentry> for information
269           about node states.
270         </para>
271       </refsect3>
272
273       <refsect3>
274         <title>Generation</title>
275         <para>
276           The generation id is a number that indicates the current generation 
277           of a cluster instance. Each time a cluster goes through a 
278           reconfiguration or a recovery its generation id will be changed.
279         </para>
280         <para>
281           This number does not have any particular meaning other than
282           to keep track of when a cluster has gone through a
283           recovery. It is a random number that represents the current
284           instance of a ctdb cluster and its databases.  The CTDB
285           daemon uses this number internally to be able to tell when
286           commands to operate on the cluster and the databases was
287           issued in a different generation of the cluster, to ensure
288           that commands that operate on the databases will not survive
289           across a cluster database recovery.  After a recovery, all
290           old outstanding commands will automatically become invalid.
291         </para>
292         <para>
293           Sometimes this number will be shown as "INVALID". This only means that
294           the ctdbd daemon has started but it has not yet merged with the cluster through a recovery.
295           All nodes start with generation "INVALID" and are not assigned a real
296           generation id until they have successfully been merged with a cluster
297           through a recovery.
298         </para>
299       </refsect3>
300
301       <refsect3>
302         <title>Virtual Node Number (VNN) map</title>
303         <para>
304           Consists of the number of virtual nodes and mapping from
305           virtual node numbers to physical node numbers.  Virtual
306           nodes host CTDB databases.  Only nodes that are
307           participating in the VNN map can become lmaster or dmaster
308           for database records.
309         </para>
310       </refsect3>
311
312       <refsect3>
313         <title>Recovery mode</title>
314         <para>
315           This is the current recovery mode of the cluster. There are two possible modes:
316         </para>
317         <para>
318           NORMAL - The cluster is fully operational.
319         </para>
320         <para>
321           RECOVERY - The cluster databases have all been frozen, pausing all services while the cluster awaits a recovery process to complete. A recovery process should finish within seconds. If a cluster is stuck in the RECOVERY state this would indicate a cluster malfunction which needs to be investigated.
322         </para>
323         <para>
324           Once the recovery master detects an inconsistency, for example a node 
325           becomes disconnected/connected, the recovery daemon will trigger a 
326           cluster recovery process, where all databases are remerged across the
327           cluster. When this process starts, the recovery master will first
328           "freeze" all databases to prevent applications such as samba from 
329           accessing the databases and it will also mark the recovery mode as
330           RECOVERY.
331         </para>
332         <para>
333           When the CTDB daemon starts up, it will start in RECOVERY
334           mode.  Once the node has been merged into a cluster and all
335           databases have been recovered, the node mode will change into
336           NORMAL mode and the databases will be "thawed", allowing samba
337           to access the databases again.
338         </para>
339       </refsect3>
340       <refsect3>
341         <title>Recovery master</title>
342         <para>
343           This is the cluster node that is currently designated as the recovery master. This node is responsible of monitoring the consistency of the cluster and to perform the actual recovery process when reqired.
344         </para>
345         <para>
346           Only one node at a time can be the designated recovery master. Which
347           node is designated the recovery master is decided by an election
348           process in the recovery daemons running on each node.
349         </para>
350       </refsect3>
351
352       <refsect3>
353         <title>Example</title>
354         <screen>
355 # ctdb status
356 Number of nodes:4
357 pnn:0 192.168.2.200       OK (THIS NODE)
358 pnn:1 192.168.2.201       OK
359 pnn:2 192.168.2.202       OK
360 pnn:3 192.168.2.203       OK
361 Generation:1362079228
362 Size:4
363 hash:0 lmaster:0
364 hash:1 lmaster:1
365 hash:2 lmaster:2
366 hash:3 lmaster:3
367 Recovery mode:NORMAL (0)
368 Recovery master:0
369         </screen>
370       </refsect3>
371     </refsect2>
372
373     <refsect2>
374       <title>nodestatus <optional><parameter>PNN-LIST</parameter></optional></title>
375       <para>
376         This command is similar to the <command>status</command>
377         command.  It displays the "node status" subset of output.  The
378         main differences are:
379       </para>
380
381       <itemizedlist>
382         <listitem>
383           <para>
384             The exit code is the bitwise-OR of the flags for each
385             specified node, while <command>ctdb status</command> exits
386             with 0 if it was able to retrieve status for all nodes.
387           </para>
388         </listitem>
389
390         <listitem>
391           <para>
392             <command>ctdb status</command> provides status information
393             for all nodes.  <command>ctdb nodestatus</command>
394             defaults to providing status for only the current node.
395             If PNN-LIST is provided then status is given for
396             the indicated node(s).
397           </para>
398         </listitem>
399       </itemizedlist>
400
401       <para>
402         A common invocation in scripts is <command>ctdb nodestatus
403         all</command> to check whether all nodes in a cluster are
404         healthy.
405       </para>
406
407       <refsect3>
408         <title>Example</title>
409         <screen>
410 # ctdb nodestatus
411 pnn:0 10.0.0.30        OK (THIS NODE)
412
413 # ctdb nodestatus all
414 Number of nodes:2
415 pnn:0 10.0.0.30        OK (THIS NODE)
416 pnn:1 10.0.0.31        OK
417         </screen>
418       </refsect3>
419     </refsect2>
420
421     <refsect2>
422       <title>recmaster</title>
423       <para>
424         This command shows the pnn of the node which is currently the recmaster.
425       </para>
426
427       <para>
428         Note: If the the queried node is INACTIVE then the status
429         might not be current.
430       </para>
431     </refsect2>
432
433     <refsect2>
434       <title>uptime</title>
435       <para>
436         This command shows the uptime for the ctdb daemon. When the last recovery or ip-failover completed and how long it took. If the "duration" is shown as a negative number, this indicates that there is a recovery/failover in progress and it started that many seconds ago.
437       </para>
438
439       <refsect3>
440         <title>Example</title>
441         <screen>
442 # ctdb uptime
443 Current time of node          :                Thu Oct 29 10:38:54 2009
444 Ctdbd start time              : (000 16:54:28) Wed Oct 28 17:44:26 2009
445 Time of last recovery/failover: (000 16:53:31) Wed Oct 28 17:45:23 2009
446 Duration of last recovery/failover: 2.248552 seconds
447         </screen>
448       </refsect3>
449     </refsect2>
450
451     <refsect2>
452       <title>listnodes</title>
453       <para>
454         This command shows lists the ip addresses of all the nodes in the cluster.
455       </para>
456
457       <refsect3>
458         <title>Example</title>
459         <screen>
460 # ctdb listnodes
461 192.168.2.200
462 192.168.2.201
463 192.168.2.202
464 192.168.2.203
465         </screen>
466       </refsect3>
467     </refsect2>
468
469     <refsect2>
470       <title>natgwlist</title>
471       <para>
472         Show the current NAT gateway master and the status of all
473         nodes in the current NAT gateway group.  See the
474         <citetitle>NAT GATEWAY</citetitle> section in
475         <citerefentry><refentrytitle>ctdb</refentrytitle>
476         <manvolnum>7</manvolnum></citerefentry> for more details.
477       </para>
478
479       <refsect3>
480         <title>Example</title>
481         <screen>
482 # ctdb natgwlist
483 0 192.168.2.200
484 Number of nodes:4
485 pnn:0 192.168.2.200       OK (THIS NODE)
486 pnn:1 192.168.2.201       OK
487 pnn:2 192.168.2.202       OK
488 pnn:3 192.168.2.203       OK
489         </screen>
490       </refsect3>
491     </refsect2>
492
493     <refsect2>
494       <title>ping</title>
495       <para>
496         This command will "ping" specified CTDB nodes in the cluster
497         to verify that they are running.
498       </para>
499       <refsect3>
500         <title>Example</title>
501         <screen>
502 # ctdb ping
503 response from 0 time=0.000054 sec  (3 clients)
504         </screen>
505       </refsect3>
506     </refsect2>
507
508     <refsect2>
509       <title>ifaces</title>
510       <para>
511         This command will display the list of network interfaces, which could
512         host public addresses, along with their status.
513       </para>
514       <refsect3>
515         <title>Example</title>
516         <screen>
517 # ctdb ifaces
518 Interfaces on node 0
519 name:eth5 link:up references:2
520 name:eth4 link:down references:0
521 name:eth3 link:up references:1
522 name:eth2 link:up references:1
523
524 # ctdb -X ifaces
525 |Name|LinkStatus|References|
526 |eth5|1|2|
527 |eth4|0|0|
528 |eth3|1|1|
529 |eth2|1|1|
530         </screen>
531       </refsect3>
532     </refsect2>
533
534     <refsect2>
535       <title>ip</title>
536       <para>
537         This command will display the list of public addresses that are provided by the cluster and which physical node is currently serving this ip. By default this command will ONLY show those public addresses that are known to the node itself. To see the full list of all public ips across the cluster you must use "ctdb ip all".
538       </para>
539       <refsect3>
540         <title>Example</title>
541         <screen>
542 # ctdb ip -v
543 Public IPs on node 0
544 172.31.91.82 node[1] active[] available[eth2,eth3] configured[eth2,eth3]
545 172.31.91.83 node[0] active[eth3] available[eth2,eth3] configured[eth2,eth3]
546 172.31.91.84 node[1] active[] available[eth2,eth3] configured[eth2,eth3]
547 172.31.91.85 node[0] active[eth2] available[eth2,eth3] configured[eth2,eth3]
548 172.31.92.82 node[1] active[] available[eth5] configured[eth4,eth5]
549 172.31.92.83 node[0] active[eth5] available[eth5] configured[eth4,eth5]
550 172.31.92.84 node[1] active[] available[eth5] configured[eth4,eth5]
551 172.31.92.85 node[0] active[eth5] available[eth5] configured[eth4,eth5]
552
553 # ctdb -X ip -v
554 |Public IP|Node|ActiveInterface|AvailableInterfaces|ConfiguredInterfaces|
555 |172.31.91.82|1||eth2,eth3|eth2,eth3|
556 |172.31.91.83|0|eth3|eth2,eth3|eth2,eth3|
557 |172.31.91.84|1||eth2,eth3|eth2,eth3|
558 |172.31.91.85|0|eth2|eth2,eth3|eth2,eth3|
559 |172.31.92.82|1||eth5|eth4,eth5|
560 |172.31.92.83|0|eth5|eth5|eth4,eth5|
561 |172.31.92.84|1||eth5|eth4,eth5|
562 |172.31.92.85|0|eth5|eth5|eth4,eth5|
563         </screen>
564       </refsect3>
565     </refsect2>
566
567     <refsect2>
568       <title>ipinfo <parameter>IP</parameter></title>
569       <para>
570         This command will display details about the specified public addresses.
571       </para>
572       <refsect3>
573         <title>Example</title>
574         <screen>
575 # ctdb ipinfo 172.31.92.85
576 Public IP[172.31.92.85] info on node 0
577 IP:172.31.92.85
578 CurrentNode:0
579 NumInterfaces:2
580 Interface[1]: Name:eth4 Link:down References:0
581 Interface[2]: Name:eth5 Link:up References:2 (active)
582         </screen>
583       </refsect3>
584     </refsect2>
585
586     <refsect2>
587       <title>scriptstatus</title>
588       <para>
589         This command displays which scripts where run in the previous monitoring cycle and the result of each script. If a script failed with an error, causing the node to become unhealthy, the output from that script is also shown.
590       </para>
591       <refsect3>
592         <title>Example</title>
593         <screen>
594 # ctdb scriptstatus
595 7 scripts were executed last monitoring cycle
596 00.ctdb              Status:OK    Duration:0.056 Tue Mar 24 18:56:57 2009
597 10.interface         Status:OK    Duration:0.077 Tue Mar 24 18:56:57 2009
598 11.natgw             Status:OK    Duration:0.039 Tue Mar 24 18:56:57 2009
599 20.multipathd        Status:OK    Duration:0.038 Tue Mar 24 18:56:57 2009
600 31.clamd             Status:DISABLED
601 40.vsftpd            Status:OK    Duration:0.045 Tue Mar 24 18:56:57 2009
602 41.httpd             Status:OK    Duration:0.039 Tue Mar 24 18:56:57 2009
603 50.samba             Status:ERROR    Duration:0.082 Tue Mar 24 18:56:57 2009
604 OUTPUT:ERROR: Samba tcp port 445 is not responding
605       </screen>
606       </refsect3>
607     </refsect2>
608
609     <refsect2>
610       <title>disablescript <parameter>SCRIPT</parameter></title>
611       <para>
612         This command is used to disable an eventscript.
613       </para>
614       <para>
615         This will take effect the next time the eventscripts are being executed so it can take a short while until this is reflected in 'scriptstatus'.
616       </para>
617     </refsect2>
618
619     <refsect2>
620       <title>enablescript <parameter>SCRIPT</parameter></title>
621       <para>
622         This command is used to enable an eventscript.
623       </para>
624       <para>
625         This will take effect the next time the eventscripts are being executed so it can take a short while until this is reflected in 'scriptstatus'.
626       </para>
627     </refsect2>
628
629     <refsect2>
630       <title>listvars</title>
631       <para>
632         List all tuneable variables, except the values of the obsolete tunables
633         like VacuumMinInterval. The obsolete tunables can be retrieved only
634         explicitly with the "ctdb getvar" command.
635       </para>
636       <refsect3>
637         <title>Example</title>
638         <screen>
639 # ctdb listvars
640 SeqnumInterval          = 1000
641 ControlTimeout          = 60
642 TraverseTimeout         = 20
643 KeepaliveInterval       = 5
644 KeepaliveLimit          = 5
645 RecoverTimeout          = 120
646 RecoverInterval         = 1
647 ElectionTimeout         = 3
648 TakeoverTimeout         = 9
649 MonitorInterval         = 15
650 TickleUpdateInterval    = 20
651 EventScriptTimeout      = 30
652 MonitorTimeoutCount     = 20
653 RecoveryGracePeriod     = 120
654 RecoveryBanPeriod       = 300
655 DatabaseHashSize        = 100001
656 DatabaseMaxDead         = 5
657 RerecoveryTimeout       = 10
658 EnableBans              = 1
659 DeterministicIPs        = 0
660 LCP2PublicIPs           = 1
661 NoIPFailback            = 0
662 DisableIPFailover       = 0
663 VerboseMemoryNames      = 0
664 RecdPingTimeout         = 60
665 RecdFailCount           = 10
666 LogLatencyMs            = 0
667 RecLockLatencyMs        = 1000
668 RecoveryDropAllIPs      = 120
669 VacuumInterval          = 10
670 VacuumMaxRunTime        = 120
671 RepackLimit             = 10000
672 VacuumLimit             = 5000
673 VacuumFastPathCount     = 60
674 MaxQueueDropMsg         = 1000000
675 AllowUnhealthyDBRead    = 0
676 StatHistoryInterval     = 1
677 DeferredAttachTO        = 120
678 AllowClientDBAttach     = 1
679 RecoverPDBBySeqNum      = 1
680 DeferredRebalanceOnNodeAdd = 300
681 FetchCollapse           = 1
682 HopcountMakeSticky      = 50
683 StickyDuration          = 600
684 StickyPindown           = 200
685 NoIPTakeover            = 0
686 DBRecordCountWarn       = 100000
687 DBRecordSizeWarn        = 10000000
688 DBSizeWarn              = 100000000
689 PullDBPreallocation     = 10485760
690 NoIPHostOnAllDisabled   = 0
691 Samba3AvoidDeadlocks    = 0
692 TDBMutexEnabled         = 0
693 LockProcessesPerDB      = 200
694         </screen>
695       </refsect3>
696     </refsect2>
697
698     <refsect2>
699       <title>getvar <parameter>NAME</parameter></title>
700       <para>
701         Get the runtime value of a tuneable variable.
702       </para>
703       <refsect3>
704         <title>Example</title>
705         <screen>
706 # ctdb getvar MonitorInterval
707 MonitorInterval         = 15
708         </screen>
709       </refsect3>
710     </refsect2>
711
712     <refsect2>
713       <title>setvar <parameter>NAME</parameter> <parameter>VALUE</parameter></title>
714       <para>
715         Set the runtime value of a tuneable variable.
716       </para>
717       <refsect3>
718         <title>Example</title>
719         <screen>
720 # ctdb setvar MonitorInterval 20
721         </screen>
722       </refsect3>
723     </refsect2>
724
725     <refsect2>
726       <title>lvsmaster</title>
727       <para>
728         This command shows which node is currently the LVSMASTER. The
729         LVSMASTER is the node in the cluster which drives the LVS system and
730         which receives all incoming traffic from clients.
731       </para>
732       <para>
733         LVS is the mode where the entire CTDB/Samba cluster uses a single
734         ip address for the entire cluster. In this mode all clients connect to
735         one specific node which will then multiplex/loadbalance the clients
736         evenly onto the other nodes in the cluster. This is an alternative to using
737         public ip addresses. See the manpage for ctdbd for more information
738         about LVS.
739       </para>
740     </refsect2>
741
742     <refsect2>
743       <title>lvs</title>
744       <para>
745         This command shows which nodes in the cluster are currently active in the
746         LVS configuration. I.e. which nodes we are currently loadbalancing
747         the single ip address across.
748       </para>
749
750       <para>
751         LVS will by default only loadbalance across those nodes that are both
752         LVS capable and also HEALTHY. Except if all nodes are UNHEALTHY in which
753         case LVS will loadbalance across all UNHEALTHY nodes as well.
754         LVS will never use nodes that are DISCONNECTED, STOPPED, BANNED or
755         DISABLED.
756       </para>
757
758       <para>
759         Example output:
760       </para>
761       <screen>
762 2:10.0.0.13
763 3:10.0.0.14
764       </screen>
765
766     </refsect2>
767
768
769     <refsect2>
770       <title>getcapabilities</title>
771
772       <para>
773         This command shows the capabilities of the current node.  See
774         the <citetitle>CAPABILITIES</citetitle> section in
775         <citerefentry><refentrytitle>ctdb</refentrytitle>
776         <manvolnum>7</manvolnum></citerefentry> for more details.
777       </para>
778
779       <para>
780         Example output:
781       </para>
782       <screen>
783 RECMASTER: YES
784 LMASTER: YES
785 LVS: NO
786       </screen>
787
788     </refsect2>
789
790     <refsect2>
791       <title>statistics</title>
792       <para>
793         Collect statistics from the CTDB daemon about
794         how many calls it has served.  Information about
795         various fields in statistics can be found in
796         <citerefentry><refentrytitle>ctdb-statistics</refentrytitle>
797         <manvolnum>7</manvolnum></citerefentry>.
798       </para>
799       <refsect3>
800         <title>Example</title>
801         <screen>
802 # ctdb statistics
803 CTDB version 1
804 Current time of statistics  :                Tue Mar  8 15:18:51 2016
805 Statistics collected since  : (003 21:31:32) Fri Mar  4 17:47:19 2016
806  num_clients                        9
807  frozen                             0
808  recovering                         0
809  num_recoveries                     2
810  client_packets_sent          8170534
811  client_packets_recv          7166132
812  node_packets_sent           16549998
813  node_packets_recv            5244418
814  keepalive_packets_sent        201969
815  keepalive_packets_recv        201969
816  node
817      req_call                      26
818      reply_call                     0
819      req_dmaster                    9
820      reply_dmaster                 12
821      reply_error                    0
822      req_message              1339231
823      req_control              8177506
824      reply_control            6831284
825  client
826      req_call                      15
827      req_message               334809
828      req_control              6831308
829  timeouts
830      call                           0
831      control                        0
832      traverse                       0
833  locks
834      num_calls                      8
835      num_current                    0
836      num_pending                    0
837      num_failed                     0
838  total_calls                       15
839  pending_calls                      0
840  childwrite_calls                   0
841  pending_childwrite_calls             0
842  memory_used                   394879
843  max_hop_count                      1
844  total_ro_delegations               0
845  total_ro_revokes                   0
846  hop_count_buckets: 8 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0
847  lock_buckets: 0 0 8 0 0 0 0 0 0 0 0 0 0 0 0 0
848  locks_latency      MIN/AVG/MAX     0.010005/0.010418/0.011010 sec out of 8
849  reclock_ctdbd      MIN/AVG/MAX     0.002538/0.002538/0.002538 sec out of 1
850  reclock_recd       MIN/AVG/MAX     0.000000/0.000000/0.000000 sec out of 0
851  call_latency       MIN/AVG/MAX     0.000044/0.002142/0.011702 sec out of 15
852  childwrite_latency MIN/AVG/MAX     0.000000/0.000000/0.000000 sec out of 0
853         </screen>
854       </refsect3>
855     </refsect2>
856
857     <refsect2>
858       <title>statisticsreset</title>
859       <para>
860         This command is used to clear all statistics counters in a node.
861       </para>
862       <para>
863         Example: ctdb statisticsreset
864       </para>
865     </refsect2>
866
867     <refsect2>
868       <title>dbstatistics <parameter>DB</parameter></title>
869       <para>
870         Display statistics about the database DB.  Information
871         about various fields in dbstatistics can be found in
872         <citerefentry><refentrytitle>ctdb-statistics</refentrytitle>
873         <manvolnum>7</manvolnum></citerefentry>.
874       </para>
875       <refsect3>
876         <title>Example</title>
877         <screen>
878 # ctdb dbstatistics locking.tdb
879 DB Statistics: locking.tdb
880  ro_delegations                     0
881  ro_revokes                         0
882  locks
883      total                      14356
884      failed                         0
885      current                        0
886      pending                        0
887  hop_count_buckets: 28087 2 1 0 0 0 0 0 0 0 0 0 0 0 0 0
888  lock_buckets: 0 14188 38 76 32 19 3 0 0 0 0 0 0 0 0 0
889  locks_latency      MIN/AVG/MAX     0.001066/0.012686/4.202292 sec out of 14356
890  vacuum_latency     MIN/AVG/MAX     0.000472/0.002207/15.243570 sec out of 224530
891  Num Hot Keys:     1
892      Count:8 Key:ff5bd7cb3ee3822edc1f0000000000000000000000000000
893         </screen>
894       </refsect3>
895     </refsect2>
896
897     <refsect2>
898       <title>getreclock</title>
899       <para>
900         Show the name of the recovery lock file, if any.
901       </para>
902
903       <para>
904         Example output:
905       </para>
906       <screen>
907         Reclock file:/clusterfs/.ctdb/recovery.lock
908       </screen>
909
910     </refsect2>
911
912     <refsect2>
913       <title>
914         setreclock <optional><parameter>FILE</parameter></optional>
915       </title>
916
917       <para>
918         FILE specifies the name of the recovery lock file.  If the
919         recovery lock file is changed at run-time then this will cause
920         a recovery, which in turn causes the recovery lock to be
921         retaken.
922       </para>
923
924       <para>
925         If no FILE is specified then a recovery lock file will no
926         longer be used.
927       </para>
928
929       <para>
930         This command only affects the run-time setting of a single
931         CTDB node.  This setting <emphasis>must</emphasis> be changed
932         on all nodes simultaneously.  For information about configuring
933         the recovery lock file please see the
934         <citetitle>CTDB_RECOVERY_LOCK</citetitle> entry in
935         <citerefentry><refentrytitle>ctdbd.conf</refentrytitle>
936         <manvolnum>5</manvolnum></citerefentry> and the
937         <citetitle>--reclock</citetitle> entry in
938         <citerefentry><refentrytitle>ctdbd</refentrytitle>
939         <manvolnum>1</manvolnum></citerefentry>.  For information
940         about the recovery lock please see the <citetitle>RECOVERY
941         LOCK</citetitle> section in
942         <citerefentry><refentrytitle>ctdb</refentrytitle>
943         <manvolnum>7</manvolnum></citerefentry>.
944       </para>
945     </refsect2>
946
947
948
949     <refsect2>
950       <title>getdebug</title>
951       <para>
952         Get the current debug level for the node. the debug level controls what information is written to the log file.
953       </para>
954       <para>
955         The debug levels are mapped to the corresponding syslog levels.
956         When a debug level is set, only those messages at that level and higher
957         levels will be printed.
958       </para>
959       <para>
960         The list of debug levels from highest to lowest are :
961       </para>
962       <para>
963         ERR WARNING NOTICE INFO DEBUG
964       </para>
965     </refsect2>
966
967     <refsect2>
968       <title>setdebug <parameter>DEBUGLEVEL</parameter></title>
969       <para>
970         Set the debug level of a node. This controls what information will be logged.
971       </para>
972       <para>
973         The debuglevel is one of ERR WARNING NOTICE INFO DEBUG
974       </para>
975     </refsect2>
976
977     <refsect2>
978       <title>getpid</title>
979       <para>
980         This command will return the process id of the ctdb daemon.
981       </para>
982     </refsect2>
983
984     <refsect2>
985       <title>disable</title>
986       <para>
987         This command is used to administratively disable a node in the cluster.
988         A disabled node will still participate in the cluster and host
989         clustered TDB records but its public ip address has been taken over by
990         a different node and it no longer hosts any services.
991       </para>
992     </refsect2>
993
994     <refsect2>
995       <title>enable</title>
996       <para>
997         Re-enable a node that has been administratively disabled.
998       </para>
999     </refsect2>
1000
1001     <refsect2>
1002       <title>stop</title>
1003       <para>
1004         This command is used to administratively STOP a node in the cluster.
1005         A STOPPED node is connected to the cluster but will not host any
1006         public ip addresse, nor does it participate in the VNNMAP.
1007         The difference between a DISABLED node and a STOPPED node is that
1008         a STOPPED node does not host any parts of the database which means
1009         that a recovery is required to stop/continue nodes.
1010       </para>
1011     </refsect2>
1012
1013     <refsect2>
1014       <title>continue</title>
1015       <para>
1016         Re-start a node that has been administratively stopped.
1017       </para>
1018     </refsect2>
1019
1020     <refsect2>
1021       <title>addip <parameter>IPADDR</parameter>/<parameter>mask</parameter> <parameter>IFACE</parameter></title>
1022       <para>
1023         This command is used to add a new public ip to a node during runtime.
1024         This allows public addresses to be added to a cluster without having
1025         to restart the ctdb daemons.
1026       </para>
1027       <para>
1028         Note that this only updates the runtime instance of ctdb. Any changes will be lost next time ctdb is restarted and the public addresses file is re-read.
1029         If you want this change to be permanent you must also update the public addresses file manually.
1030       </para>
1031     </refsect2>
1032
1033     <refsect2>
1034       <title>delip <parameter>IPADDR</parameter></title>
1035       <para>
1036         This command is used to remove a public ip from a node during runtime.
1037         If this public ip is currently hosted by the node it being removed from, the ip will first be failed over to another node, if possible, before it is removed.
1038       </para>
1039       <para>
1040         Note that this only updates the runtime instance of ctdb. Any changes will be lost next time ctdb is restarted and the public addresses file is re-read.
1041         If you want this change to be permanent you must also update the public addresses file manually.
1042       </para>
1043     </refsect2>
1044
1045     <refsect2>
1046       <title>moveip <parameter>IPADDR</parameter> <parameter>PNN</parameter></title>
1047       <para>
1048         This command can be used to manually fail a public ip address to a
1049         specific node.
1050       </para>
1051       <para>
1052         In order to manually override the "automatic" distribution of public 
1053         ip addresses that ctdb normally provides, this command only works
1054         when you have changed the tunables for the daemon to:
1055       </para>
1056       <para>
1057         DeterministicIPs = 0
1058       </para>
1059       <para>
1060         NoIPFailback = 1
1061       </para>
1062     </refsect2>
1063
1064     <refsect2>
1065       <title>shutdown</title>
1066       <para>
1067         This command will shutdown a specific CTDB daemon.
1068       </para>
1069     </refsect2>
1070
1071     <refsect2>
1072       <title>setlmasterrole on|off</title>
1073       <para>
1074         This command is used ot enable/disable the LMASTER capability for a node at runtime. This capability determines whether or not a node can be used as an LMASTER for records in the database. A node that does not have the LMASTER capability will not show up in the vnnmap.
1075       </para>
1076
1077       <para>
1078         Nodes will by default have this capability, but it can be stripped off nodes by the setting in the sysconfig file or by using this command.
1079       </para>
1080       <para>
1081         Once this setting has been enabled/disabled, you need to perform a recovery for it to take effect.
1082       </para>
1083       <para>
1084         See also "ctdb getcapabilities"
1085       </para>
1086     </refsect2>
1087
1088     <refsect2>
1089       <title>setrecmasterrole on|off</title>
1090       <para>
1091         This command is used ot enable/disable the RECMASTER capability for a node at runtime. This capability determines whether or not a node can be used as an RECMASTER for the cluster. A node that does not have the RECMASTER capability can not win a recmaster election. A node that already is the recmaster for the cluster when the capability is stripped off the node will remain the recmaster until the next cluster election.
1092       </para>
1093
1094       <para>
1095         Nodes will by default have this capability, but it can be stripped off nodes by the setting in the sysconfig file or by using this command.
1096       </para>
1097       <para>
1098         See also "ctdb getcapabilities"
1099       </para>
1100     </refsect2>
1101
1102     <refsect2>
1103       <title>reloadnodes</title>
1104       <para>
1105         This command is used when adding new nodes, or removing
1106         existing nodes from an existing cluster.
1107       </para>
1108       <para>
1109         Procedure to add nodes:
1110       </para>
1111       <orderedlist>
1112         <listitem>
1113           <para>
1114              To expand an existing cluster, first ensure with
1115              <command>ctdb status</command> that all nodes are up and
1116              running and that they are all healthy.  Do not try to
1117              expand a cluster unless it is completely healthy!
1118           </para>
1119         </listitem>
1120         <listitem>
1121           <para>
1122             On all nodes, edit <filename>/usr/local/etc/ctdb/nodes</filename>
1123             and <emphasis>add the new nodes at the end of this
1124             file</emphasis>.
1125           </para>
1126         </listitem>
1127         <listitem>
1128           <para>
1129             Verify that all the nodes have identical
1130             <filename>/usr/local/etc/ctdb/nodes</filename> files after adding
1131             the new nodes.
1132           </para>
1133         </listitem>
1134         <listitem>
1135           <para>
1136             Run <command>ctdb reloadnodes</command> to force all nodes
1137             to reload the nodes file.
1138           </para>
1139         </listitem>
1140         <listitem>
1141           <para>
1142             Use <command>ctdb status</command> on all nodes and verify
1143             that they now show the additional nodes.
1144           </para>
1145         </listitem>
1146         <listitem>
1147           <para>
1148             Install and configure the new node and bring it online.
1149           </para>
1150         </listitem>
1151       </orderedlist>
1152       <para>
1153         Procedure to remove nodes:
1154       </para>
1155       <orderedlist>
1156         <listitem>
1157           <para>
1158             To remove nodes from an existing cluster, first ensure
1159             with <command>ctdb status</command> that all nodes, except
1160             the node to be deleted, are up and running and that they
1161             are all healthy.  Do not try to remove nodes from a
1162             cluster unless the cluster is completely healthy!
1163           </para>
1164         </listitem>
1165         <listitem>
1166           <para>
1167             Shutdown and power off the node to be removed.
1168           </para>
1169         </listitem>
1170         <listitem>
1171           <para>
1172             On all other nodes, edit the
1173             <filename>/usr/local/etc/ctdb/nodes</filename> file and
1174             <emphasis>comment out</emphasis> the nodes to be removed.
1175             <emphasis>Do not delete the lines for the deleted
1176             nodes</emphasis>, just comment them out by adding a '#' at
1177             the beginning of the lines.
1178           </para>
1179         </listitem>
1180         <listitem>
1181           <para>
1182             Run <command>ctdb reloadnodes</command> to force all nodes
1183             to reload the nodes file.
1184           </para>
1185         </listitem>
1186         <listitem>
1187           <para>
1188             Use <command>ctdb status</command> on all nodes and verify
1189             that the deleted nodes are no longer listed.
1190           </para>
1191         </listitem>
1192       </orderedlist>
1193
1194     </refsect2>
1195
1196     <refsect2>
1197       <title>
1198         reloadips
1199         <optional><parameter>PNN-LIST</parameter></optional>
1200       </title>
1201       <para>
1202         This command reloads the public addresses configuration file
1203         on the specified nodes.  When it completes addresses will be
1204         reconfigured and reassigned across the cluster as necessary.
1205       </para>
1206     </refsect2>
1207
1208     <refsect2>
1209       <title>getdbmap</title>
1210       <para>
1211         This command lists all clustered TDB databases that the CTDB daemon has attached to. Some databases are flagged as PERSISTENT, this means that the database stores data persistently and the data will remain across reboots. One example of such a database is secrets.tdb where information about how the cluster was joined to the domain is stored.
1212       </para>
1213       <para>
1214         If a PERSISTENT database is not in a healthy state the database is
1215         flagged as UNHEALTHY. If there's at least one completely healthy node running in
1216         the cluster, it's possible that the content is restored by a recovery
1217         run automaticly. Otherwise an administrator needs to analyze the
1218         problem.
1219       </para>
1220       <para>
1221         See also "ctdb getdbstatus", "ctdb backupdb", "ctdb restoredb",
1222         "ctdb dumpbackup", "ctdb wipedb", "ctdb setvar AllowUnhealthyDBRead 1"
1223         and (if samba or tdb-utils are installed) "tdbtool check".
1224       </para>
1225       <para>
1226         Most databases are not persistent and only store the state information that the currently running samba daemons need. These databases are always wiped when ctdb/samba starts and when a node is rebooted.
1227       </para>
1228
1229       <refsect3>
1230         <title>Example</title>
1231         <screen>
1232 # ctdb getdbmap
1233 Number of databases:10
1234 dbid:0x435d3410 name:notify.tdb path:/usr/local/var/lib/ctdb/notify.tdb.0
1235 dbid:0x42fe72c5 name:locking.tdb path:/usr/local/var/lib/ctdb/locking.tdb.0
1236 dbid:0x1421fb78 name:brlock.tdb path:/usr/local/var/lib/ctdb/brlock.tdb.0
1237 dbid:0x17055d90 name:connections.tdb path:/usr/local/var/lib/ctdb/connections.tdb.0
1238 dbid:0xc0bdde6a name:sessionid.tdb path:/usr/local/var/lib/ctdb/sessionid.tdb.0
1239 dbid:0x122224da name:test.tdb path:/usr/local/var/lib/ctdb/test.tdb.0
1240 dbid:0x2672a57f name:idmap2.tdb path:/usr/local/var/lib/ctdb/persistent/idmap2.tdb.0 PERSISTENT
1241 dbid:0xb775fff6 name:secrets.tdb path:/usr/local/var/lib/ctdb/persistent/secrets.tdb.0 PERSISTENT
1242 dbid:0xe98e08b6 name:group_mapping.tdb path:/usr/local/var/lib/ctdb/persistent/group_mapping.tdb.0 PERSISTENT
1243 dbid:0x7bbbd26c name:passdb.tdb path:/usr/local/var/lib/ctdb/persistent/passdb.tdb.0 PERSISTENT
1244
1245 # ctdb getdbmap  # example for unhealthy database
1246 Number of databases:1
1247 dbid:0xb775fff6 name:secrets.tdb path:/usr/local/var/lib/ctdb/persistent/secrets.tdb.0 PERSISTENT UNHEALTHY
1248
1249 # ctdb -X getdbmap
1250 |ID|Name|Path|Persistent|Unhealthy|
1251 |0x7bbbd26c|passdb.tdb|/usr/local/var/lib/ctdb/persistent/passdb.tdb.0|1|0|
1252         </screen>
1253       </refsect3>
1254     </refsect2>
1255
1256     <refsect2>
1257       <title>
1258         backupdb
1259         <parameter>DB</parameter>
1260         <parameter>FILE</parameter>
1261       </title>
1262       <para>
1263         Copy the contents of database DB to FILE.  FILE can later be
1264         read back using <command>restoredb</command>.  This is mainly
1265         useful for backing up persistent databases such as
1266         <filename>secrets.tdb</filename> and similar.
1267       </para>
1268     </refsect2>
1269
1270     <refsect2>
1271       <title>
1272         restoredb
1273         <parameter>FILE</parameter>
1274         <optional><parameter>DB</parameter></optional>
1275       </title>
1276       <para>
1277         This command restores a persistent database that was
1278         previously backed up using backupdb.  By default the data will
1279         be restored back into the same database as it was created
1280         from. By specifying dbname you can restore the data into a
1281         different database.
1282       </para>
1283     </refsect2>
1284
1285     <refsect2>
1286       <title>setdbreadonly <parameter>DB</parameter></title>
1287       <para>
1288         This command will enable the read-only record support for a
1289         database.  This is an experimental feature to improve
1290         performance for contended records primarily in locking.tdb and
1291         brlock.tdb.  When enabling this feature you must set it on all
1292         nodes in the cluster.
1293       </para>
1294     </refsect2>
1295
1296     <refsect2>
1297       <title>setdbsticky <parameter>DB</parameter></title>
1298       <para>
1299         This command will enable the sticky record support for the
1300         specified database.  This is an experimental feature to
1301         improve performance for contended records primarily in
1302         locking.tdb and brlock.tdb.  When enabling this feature you
1303         must set it on all nodes in the cluster.
1304       </para>
1305     </refsect2>
1306
1307   </refsect1>
1308
1309   <refsect1>
1310     <title>INTERNAL COMMANDS</title>
1311
1312     <para>
1313       Internal commands are used by CTDB's scripts and are not
1314       required for managing a CTDB cluster.  Their parameters and
1315       behaviour are subject to change.
1316     </para>
1317
1318     <refsect2>
1319       <title>gettickles <parameter>IPADDR</parameter></title>
1320       <para>
1321         Show TCP connections that are registered with CTDB to be
1322         "tickled" if there is a failover.
1323       </para>
1324     </refsect2>
1325
1326     <refsect2>
1327       <title>gratiousarp <parameter>IPADDR</parameter> <parameter>INTERFACE</parameter></title>
1328       <para>
1329         Send out a gratious ARP for the specified interface through
1330         the specified interface. This command is mainly used by the
1331         ctdb eventscripts.
1332       </para>
1333     </refsect2>
1334
1335     <refsect2>
1336       <title>killtcp</title>
1337       <para>
1338         Read a list of TCP connections, one per line, from standard
1339         input and terminate each connection.  A connection is
1340         specified as:
1341       </para>
1342       <synopsis>
1343         <parameter>SRC-IPADDR</parameter>:<parameter>SRC-PORT</parameter> <parameter>DST-IPADDR</parameter>:<parameter>DST-PORT</parameter>
1344       </synopsis>
1345       <para>
1346         Each connection is terminated by issuing a TCP RST to the
1347         SRC-IPADDR:SRC-PORT endpoint.
1348       </para>
1349       <para>
1350         A single connection can be specified on the command-line
1351         rather than on standard input.
1352       </para>
1353     </refsect2>
1354
1355     <refsect2>
1356       <title>
1357         pdelete <parameter>DB</parameter> <parameter>KEY</parameter>
1358       </title>
1359       <para>
1360         Delete KEY from DB.
1361       </para>
1362     </refsect2>
1363
1364     <refsect2>
1365       <title>
1366         pfetch <parameter>DB</parameter> <parameter>KEY</parameter>
1367       </title>
1368       <para>
1369         Print the value associated with KEY in DB.
1370       </para>
1371     </refsect2>
1372
1373     <refsect2>
1374       <title>
1375         pstore
1376         <parameter>DB</parameter>
1377         <parameter>KEY</parameter>
1378         <parameter>FILE</parameter>
1379       </title>
1380       <para>
1381         Store KEY in DB with contents of FILE as the associated value.
1382       </para>
1383     </refsect2>
1384
1385     <refsect2>
1386       <title>
1387         ptrans
1388         <parameter>DB</parameter>
1389         <optional><parameter>FILE</parameter></optional>
1390       </title>
1391       <para>
1392         Read a list of key-value pairs, one per line from FILE, and
1393         store them in DB using a single transaction.  An empty value
1394         is equivalent to deleting the given key.
1395       </para>
1396       <para>
1397         The key and value should be separated by spaces or tabs. Each
1398         key/value should be a printable string enclosed in
1399         double-quotes.
1400       </para>
1401     </refsect2>
1402
1403     <refsect2>
1404       <title>runstate [setup|first_recovery|startup|running]</title>
1405       <para>
1406         Print the runstate of the specified node.  Runstates are used
1407         to serialise important state transitions in CTDB, particularly
1408         during startup.
1409       </para>
1410       <para>
1411         If one or more optional runstate arguments are specified then
1412         the node must be in one of these runstates for the command to
1413         succeed.
1414       </para>
1415       <refsect3>
1416         <title>Example</title>
1417         <screen>
1418 # ctdb runstate
1419 RUNNING
1420         </screen>
1421       </refsect3>
1422     </refsect2>
1423
1424     <refsect2>
1425       <title>setifacelink <parameter>IFACE</parameter> up|down</title>
1426       <para>
1427         Set the internal state of network interface IFACE.  This is
1428         typically used in the <filename>10.interface</filename> script
1429         in the "monitor" event.
1430       </para>
1431       <para>
1432         Example: ctdb setifacelink eth0 up
1433       </para>
1434     </refsect2>
1435
1436     <refsect2>
1437       <title>tickle <parameter>SRC-IPADDR</parameter>:<parameter>SRC-PORT</parameter> <parameter>DST-IPADDR</parameter>:<parameter>DST-PORT</parameter></title>
1438       <para>
1439         Send a TCP tickle to the source host for the specified TCP
1440         connection.  A TCP tickle is a TCP ACK packet with an invalid
1441         sequence and acknowledge number and will when received by the
1442         source host result in it sending an immediate correct ACK back
1443         to the other end.
1444       </para>
1445       <para>
1446         TCP tickles are useful to "tickle" clients after a IP failover has
1447         occured since this will make the client immediately recognize the
1448         TCP connection has been disrupted and that the client will need
1449         to reestablish. This greatly speeds up the time it takes for a client
1450         to detect and reestablish after an IP failover in the ctdb cluster.
1451       </para>
1452     </refsect2>
1453
1454     <refsect2>
1455       <title>version</title>
1456       <para>
1457         Display the CTDB version.
1458       </para>
1459     </refsect2>
1460
1461   </refsect1>
1462
1463   <refsect1>
1464     <title>DEBUGGING COMMANDS</title>
1465     <para>
1466       These commands are primarily used for CTDB development and testing and
1467       should not be used for normal administration.
1468     </para>
1469
1470
1471     <refsect2>
1472       <title>OPTIONS</title>
1473
1474       <variablelist>
1475         <varlistentry><term>--print-emptyrecords</term>
1476         <listitem>
1477           <para>
1478             This enables printing of empty records when dumping databases
1479             with the catdb, cattbd and dumpdbbackup commands. Records with
1480             empty data segment are considered deleted by ctdb and cleaned
1481             by the vacuuming mechanism, so this switch can come in handy for
1482             debugging the vacuuming behaviour.
1483           </para>
1484         </listitem>
1485         </varlistentry>
1486
1487         <varlistentry><term>--print-datasize</term>
1488         <listitem>
1489           <para>
1490             This lets database dumps (catdb, cattdb, dumpdbbackup) print the
1491             size of the record data instead of dumping the data contents.
1492           </para>
1493         </listitem>
1494         </varlistentry>
1495
1496         <varlistentry><term>--print-lmaster</term>
1497         <listitem>
1498           <para>
1499             This lets catdb print the lmaster for each record.
1500           </para>
1501         </listitem>
1502         </varlistentry>
1503
1504         <varlistentry><term>--print-hash</term>
1505         <listitem>
1506           <para>
1507             This lets database dumps (catdb, cattdb, dumpdbbackup) print the
1508             hash for each record.
1509           </para>
1510         </listitem>
1511         </varlistentry>
1512
1513         <varlistentry><term>--print-recordflags</term>
1514         <listitem>
1515           <para>
1516             This lets catdb and dumpdbbackup print the
1517             record flags for each record. Note that cattdb always
1518             prints the flags.
1519           </para>
1520         </listitem>
1521         </varlistentry>
1522
1523       </variablelist>
1524     </refsect2>
1525
1526     <refsect2>
1527       <title>process-exists <parameter>PID</parameter></title>
1528       <para>
1529         This command checks if a specific process exists on the CTDB host. This is mainly used by Samba to check if remote instances of samba are still running or not.
1530       </para>
1531     </refsect2>
1532
1533     <refsect2>
1534       <title>getdbstatus <parameter>DB</parameter></title>
1535       <para>
1536         This command displays more details about a database.
1537       </para>
1538       <refsect3>
1539         <title>Example</title>
1540         <screen>
1541 # ctdb getdbstatus test.tdb.0
1542 dbid: 0x122224da
1543 name: test.tdb
1544 path: /usr/local/var/lib/ctdb/test.tdb.0
1545 PERSISTENT: no
1546 HEALTH: OK
1547
1548 # ctdb getdbstatus registry.tdb  # with a corrupted TDB
1549 dbid: 0xf2a58948
1550 name: registry.tdb
1551 path: /usr/local/var/lib/ctdb/persistent/registry.tdb.0
1552 PERSISTENT: yes
1553 HEALTH: NO-HEALTHY-NODES - ERROR - Backup of corrupted TDB in '/usr/local/var/lib/ctdb/persistent/registry.tdb.0.corrupted.20091208091949.0Z'
1554         </screen>
1555       </refsect3>
1556     </refsect2>
1557
1558     <refsect2>
1559       <title>catdb <parameter>DB</parameter></title>
1560       <para>
1561         Print a dump of the clustered TDB database DB.
1562       </para>
1563     </refsect2>
1564
1565     <refsect2>
1566       <title>cattdb <parameter>DB</parameter></title>
1567       <para>
1568         Print a dump of the contents of the local TDB database DB.
1569       </para>
1570     </refsect2>
1571
1572     <refsect2>
1573       <title>dumpdbbackup <parameter>FILE</parameter></title>
1574       <para>
1575         Print a dump of the contents from database backup FILE,
1576         similar to <command>catdb</command>.
1577       </para>
1578     </refsect2>
1579
1580     <refsect2>
1581       <title>wipedb <parameter>DB</parameter></title>
1582       <para>
1583         Remove all contents of database DB.
1584       </para>
1585     </refsect2>
1586
1587     <refsect2>
1588       <title>recover</title>
1589       <para>
1590         This command will trigger the recovery daemon to do a cluster
1591         recovery.
1592       </para>
1593     </refsect2>
1594
1595     <refsect2>
1596       <title>ipreallocate, sync</title>
1597       <para>
1598         This command will force the recovery master to perform a full ip reallocation process and redistribute all ip addresses. This is useful to "reset" the allocations back to its default state if they have been changed using the "moveip" command. While a "recover" will also perform this reallocation, a recovery is much more hevyweight since it will also rebuild all the databases.
1599       </para>
1600     </refsect2>
1601
1602     <refsect2>
1603       <title>getmonmode</title>
1604       <para>
1605         This command returns the monutoring mode of a node. The monitoring mode is either ACTIVE or DISABLED. Normally a node will continuously monitor that all other nodes that are expected are in fact connected and that they respond to commands.
1606       </para>
1607       <para>
1608         ACTIVE - This is the normal mode. The node is actively monitoring all other nodes, both that the transport is connected and also that the node responds to commands. If a node becomes unavailable, it will be marked as DISCONNECTED and a recovery is initiated to restore the cluster.
1609       </para>
1610       <para>
1611         DISABLED - This node is not monitoring that other nodes are available. In this mode a node failure will not be detected and no recovery will be performed. This mode is useful when for debugging purposes one wants to attach GDB to a ctdb process but wants to prevent the rest of the cluster from marking this node as DISCONNECTED and do a recovery.
1612       </para>
1613     </refsect2>
1614
1615
1616     <refsect2>
1617       <title>setmonmode 0|1</title>
1618       <para>
1619         This command can be used to explicitly disable/enable monitoring mode on a node. The main purpose is if one wants to attach GDB to a running ctdb daemon but wants to prevent the other nodes from marking it as DISCONNECTED and issuing a recovery. To do this, set monitoring mode to 0 on all nodes before attaching with GDB. Remember to set monitoring mode back to 1 afterwards.
1620       </para>
1621     </refsect2>
1622
1623     <refsect2>
1624       <title>attach <parameter>DBNAME</parameter> [persistent]</title>
1625       <para>
1626         Create a new CTDB database called DBNAME and attach to it on
1627         all nodes.
1628       </para>
1629     </refsect2>
1630
1631     <refsect2>
1632       <title>detach <parameter>DB-LIST</parameter></title>
1633       <para>
1634         Detach specified non-persistent database(s) from the cluster. This
1635         command will disconnect specified database(s) on all nodes in
1636         the cluster.  This command should only be used when none of the
1637         specified database(s) are in use.
1638       </para>
1639       <para>
1640         All nodes should be active and tunable AllowClientDBAccess should
1641         be disabled on all nodes before detaching databases.
1642       </para>
1643     </refsect2>
1644
1645     <refsect2>
1646       <title>dumpmemory</title>
1647       <para>
1648         This is a debugging command. This command will make the ctdb
1649         daemon to write a fill memory allocation map to standard output.
1650       </para>
1651     </refsect2>
1652
1653     <refsect2>
1654       <title>rddumpmemory</title>
1655       <para>
1656         This is a debugging command. This command will dump the talloc memory
1657         allocation tree for the recovery daemon to standard output.
1658       </para>
1659     </refsect2>
1660
1661     <refsect2>
1662       <title>thaw</title>
1663       <para>
1664         Thaw a previously frozen node.
1665       </para>
1666     </refsect2>
1667
1668
1669     <refsect2>
1670       <title>eventscript <parameter>ARGUMENTS</parameter></title>
1671       <para>
1672         This is a debugging command. This command can be used to manually
1673         invoke and run the eventscritps with arbitrary arguments.
1674       </para>
1675     </refsect2>
1676
1677     <refsect2>
1678       <title>ban <parameter>BANTIME</parameter></title>
1679       <para>
1680         Administratively ban a node for BANTIME seconds.  The node
1681         will be unbanned after BANTIME seconds have elapsed.
1682       </para>
1683       <para>
1684         A banned node does not participate in the cluster.  It does
1685         not host any records for the clustered TDB and does not host
1686         any public IP addresses.
1687       </para>
1688       <para>
1689         Nodes are automatically banned if they misbehave.  For
1690         example, a node may be banned if it causes too many cluster
1691         recoveries.
1692       </para>
1693       <para>
1694         To administratively exclude a node from a cluster use the
1695         <command>stop</command> command.
1696       </para>
1697     </refsect2>
1698
1699     <refsect2>
1700       <title>unban</title>
1701       <para>
1702         This command is used to unban a node that has either been
1703         administratively banned using the ban command or has been
1704         automatically banned.
1705       </para>
1706     </refsect2>
1707
1708     <refsect2>
1709       <title>
1710         rebalancenode
1711         <optional><parameter>PNN-LIST</parameter></optional>
1712       </title>
1713       <para>
1714         This command marks the given nodes as rebalance targets in the
1715         LCP2 IP allocation algorithm.  The
1716         <command>reloadips</command> command will do this as necessary
1717         so this command should not be needed.
1718       </para>
1719     </refsect2>
1720
1721     <refsect2>
1722       <title>check_srvids <parameter>SRVID</parameter> ...</title>
1723       <para>
1724         This command checks whether a set of srvid message ports are
1725         registered on the node or not. The command takes a list of
1726         values to check.
1727       </para>
1728       <refsect3>
1729         <title>Example</title>
1730         <screen>
1731 # ctdb check_srvids 1 2 3 14765
1732 Server id 0:1 does not exist
1733 Server id 0:2 does not exist
1734 Server id 0:3 does not exist
1735 Server id 0:14765 exists
1736         </screen>
1737       </refsect3>
1738     </refsect2>
1739
1740   </refsect1>
1741
1742   <!-- UNDOCUMENTED: showban stats disablemonitor enablemonitor
1743        isnotrecmaster addtickle deltickle regsrvid unregsrvid chksrvid
1744        getsrvids rebalanceip setdbprio getdbprio msglisten msgsend
1745        tfetch tstore readkey writekey
1746        checktcpport getdbseqnum ipiface
1747   -->
1748
1749   <refsect1>
1750     <title>SEE ALSO</title>
1751     <para>
1752       <citerefentry><refentrytitle>ctdbd</refentrytitle>
1753       <manvolnum>1</manvolnum></citerefentry>,
1754
1755       <citerefentry><refentrytitle>onnode</refentrytitle>
1756       <manvolnum>1</manvolnum></citerefentry>,
1757
1758       <citerefentry><refentrytitle>ctdb</refentrytitle>
1759       <manvolnum>7</manvolnum></citerefentry>,
1760
1761       <citerefentry><refentrytitle>ctdb-statistics</refentrytitle>
1762       <manvolnum>7</manvolnum></citerefentry>,
1763
1764       <citerefentry><refentrytitle>ctdb-tunables</refentrytitle>
1765       <manvolnum>7</manvolnum></citerefentry>,
1766
1767       <ulink url="http://ctdb.samba.org/"/>
1768     </para>
1769   </refsect1>
1770
1771
1772 </refentry>