Some clean-up
[backups/.git] / main.cpp
1 #include <iostream>
2 #include <fstream>
3 #include <iterator>
4 #include <algorithm>
5 #include <cassert>
6 #include <ctime>
7
8 #include "filedata.hpp"
9
10 using namespace std;
11
12 static const unsigned int bytes_in_block = 0x800;
13 static const char * dbname = "/var/lib/backups/backups.db";
14
15 unsigned long long current_time() {
16   unsigned long long rc = 0;
17   time_t now_tt = time( 0 );
18   tm *now = localtime( &now_tt );
19   rc += ( now->tm_year + 1900ULL ) * 10000000000ULL;
20   rc += ( now->tm_mon  + 1ULL )    * 100000000ULL;
21   rc +=   now->tm_mday             * 1000000ULL;
22   rc +=   now->tm_hour             * 10000ULL;
23   rc +=   now->tm_min              * 100ULL;
24   rc +=   now->tm_sec;
25
26   return rc;
27 }
28
29 template<class I, class O, class INT>
30 bool copy_until_full( I begin, I end, O out, INT &space ) {
31   bool complete = true;
32
33   I i = begin;
34   while( 0 != space && i != end ) {
35     INT size = (*i)->getFileSize();
36     INT blocksize = blocks( size ) * bytes_in_block;
37
38     if( blocksize <= space ) {
39       space -= blocksize;
40       out = *i;
41       ++out;
42     } else {
43       // We missed a file that should be included so the backup is not complete
44       complete = false;
45     }
46     ++i;
47   }
48   return complete;
49 }
50
51 template<class SET>
52 void populate_set( istream &in, SET &files ) {
53   do {
54     FileData *data = new FileData();
55     in >> data;
56     if( data->getFileName().size() ) {
57       files.insert( data );
58     } else {
59       delete data;
60     }
61   } while( ! in.eof() );
62 }
63
64 template<class SET>
65 void partition_sets( const SET &current, const SET &old,
66                      SET &added, SET &common, SET &old_common, SET &deleted  ) {
67   FileDataNameCmp cmp;
68
69   set_difference( current.begin(), current.end(),
70                   old.begin(),     old.end(),
71                   inserter( added, added.begin() ),
72                   cmp );
73
74   set_difference( old.begin(),     old.end(),
75                   current.begin(), current.end(),
76                   inserter( deleted, deleted.begin() ),
77                   cmp );
78
79   set_union(      current.begin(), current.end(),
80                   old.begin(),     old.end(),
81                   inserter( common, common.begin() ),
82                   cmp );
83
84   set_union(      old.begin(),    old.end(),
85                   common.begin(), common.end(),
86                   inserter( old_common, old_common.begin() ),
87                   cmp );
88 }
89
90 template<class INT>
91 INT blocks( const INT &bytes ) {
92   INT numblocks = bytes / bytes_in_block;
93   if( 0 != bytes % bytes_in_block ) numblocks++;
94
95   return numblocks;
96 }
97
98 template<class ITER, class INT>
99 void sizes( ITER begin, const ITER &end, INT &numblocks, INT &numbytes ) {
100   numblocks = 0;
101   numbytes  = 0;
102
103   while( begin != end ) {
104     INT filesize = (*begin)->getFileSize();
105
106     numbytes  += filesize;
107     numblocks += blocks( filesize );
108     begin++;
109   }
110 }
111
112 template<class I, class O>
113 void copy_filenames( I begin, const I &end, O out ) {
114   while( begin != end ) {
115     string output = (*begin)->getFileName();
116     output.push_back( 0 );
117     *out = output;
118     ++out;
119     ++begin;
120   }
121 }
122
123 template<class ITER>
124 void updateLastBackupDate( ITER begin, const ITER &end, unsigned long long date ) {
125   while( begin != end ) {
126     (*begin)->setLastBackupDate( date );
127   }
128 }
129
130 template<class ITER>
131 void delete_objects( ITER begin, const ITER &end ) {
132   while( begin != end ) {
133     delete *begin;
134     ++begin;
135   }
136 }
137
138 int main() {
139   // Parse the list of current files on stdin
140   file_set current;
141   populate_set( cin, current );
142
143   file_set backed_up;
144   ifstream db( dbname );
145   if( db && db.good() ) {
146     populate_set( db, backed_up );
147   }
148
149   // Now divide the two sets into three sets (added, deleted and common )
150   file_set added, deleted, common, old_common;
151   partition_sets( current, backed_up, added, common, old_common, deleted );
152
153   // Now find the list of files to backup.
154   file_set backups;
155   insert_iterator<file_set> backups_i( backups, backups.begin() );
156
157   // backup all added files
158   copy( added.begin(), added.end(), backups_i );
159
160   // Track the total size of added files
161   unsigned long long added_blocks, added_bytes;
162   sizes( added.begin(), added.end(), added_blocks, added_bytes );
163
164   file_vector modified_files;
165   // Backup files that have been modified
166   file_set::iterator i = common.begin(), j = old_common.begin();
167   for( ; i != common.end(); ++i, ++j ) {
168     (*i)->setLastBackupDate( (*j)->getLastBackupDate() );
169
170     if( needs_backup( *j, *i ) ) modified_files.push_back( *i );
171   }
172
173   copy( modified_files.begin(), modified_files.end(), backups_i );
174
175   // Track the total size of modified files
176   unsigned long long modified_blocks, modified_bytes;
177   sizes( modified_files.begin(), modified_files.end(), modified_blocks, modified_bytes );
178
179   // Now, sort the backups by filesize and build a list that'll fit on a DVD
180   file_vector backups_s;
181   copy( backups.begin(), backups.end(), back_inserter( backups_s ) );
182
183   FileDataSizeCmp sizecmp;
184   sort( backups_s.begin(), backups_s.end(), sizecmp );
185
186   file_set final;
187   unsigned long long space = 0x100000000ULL; // After looking at how big the ISO can be and how many 1K blocks are left after formatting the filesystem I decided on an even 4GB target
188
189   insert_iterator<file_set> final_i( final, final.begin() );
190
191   // Copy files over until full or out of files
192   bool complete
193     = copy_until_full( backups_s.rbegin(), backups_s.rend(), final_i, space );
194
195   // Track the size filled up by essential backups
196   unsigned long long essential_blocks, essential_bytes;
197   sizes( final.begin(), final.end(), essential_blocks, essential_bytes );
198
199   // Now, sort the non-backed-up list by last_backup_date and back-fill
200   if( 0 != space ) {
201     file_vector leftovers;
202     FileDataNameCmp cmp;
203     set_difference( current.begin(), current.end(),
204                     final.begin(),   final.end(),
205                     back_inserter( leftovers ),
206                     cmp );
207
208     FileDataLastBackupCmp lastbackupcmp;
209     sort( leftovers.begin(), leftovers.end(), lastbackupcmp );
210
211     copy_until_full( leftovers.begin(), leftovers.end(), final_i, space );
212   }
213
214   // Track the total size to be copied to the dvd
215   unsigned long long total_blocks, total_bytes;
216   sizes( final.begin(), final.end(), total_blocks, total_bytes );
217
218   unsigned long long now = current_time();
219   updateLastBackupDate( final.begin(), final.end(), now );
220
221   // Write the 'current' list to the dbfile
222   ofstream dbout( dbname );
223   copy( current.begin(), current.end(), ostream_iterator<FileData*>( dbout ) );
224
225   // Write the 'final' list to stdout
226   copy_filenames( final.begin(), final.end(), ostream_iterator<string>( cout ) );
227
228   cerr << now << endl << endl;
229
230   cerr << "Need backing up..." << endl;
231   cerr << "     Added Bytes:            " << added_bytes << endl;
232   cerr << "     Added Blocks:           " << added_blocks << endl;
233   cerr << "     Modified Bytes:         " << modified_bytes << endl;
234   cerr << "     Modified Blocks:        " << modified_blocks << endl << endl;
235
236   cerr << "Will be backed up..." << endl;
237   cerr << "     Essential Bytes:        " << essential_bytes << endl;
238   cerr << "     Essential Blocks:       " << essential_blocks << endl;
239   cerr << "     Total Bytes:            " << total_bytes << endl;
240   cerr << "     Total Blocks:           " << total_blocks << endl << endl;
241
242   if( ! complete ) { cerr << "Backup is incomplete!" << endl; }
243
244   // Clean-up
245   delete_objects( backed_up.begin(), backed_up.end() );
246   delete_objects( current.begin(),   current.end() );
247 }