Regular commit
[backups/.git] / main.cc
1 #include <iostream>
2 #include <iterator>
3 #include <algorithm>
4 #include <cassert>
5
6 #include <sqlite3.h>
7
8 #include "filedata.hpp"
9
10 using namespace std;
11
12 vector<string> split( const string &line, char c, int limit = -1 ) {
13   string::size_type start = 0, end = 0;
14
15   vector<string> out;
16   while( 0 != limit-- && end != line.size() ) {
17     if( 0 == limit ) {
18       end = line.size();
19     } else {
20       end = line.find( c, start );
21       if( end == string::npos ) {
22         end = line.size();
23       }
24     }
25     out.push_back( line.substr( start, end-start ) );
26     start = end + 1;
27   }
28   return out;
29 }
30
31 // Callback function for getting files from the database
32 int populate_set( void *files_v, int, char **vals, char ** ) {
33   file_set *files = reinterpret_cast<file_set*>( files_v );
34   files->insert( new FileData( vals[0][0],
35         vals[1],
36         vals[2],
37         vals[3],
38         atoi( vals[4] ),
39         atoi( vals[5] ),
40         vals[6]) );
41   return 0;
42 }
43
44 int main() {
45   string file_string;
46
47   file_set current;
48
49   // Parse the list of files on stdin
50   do {
51     file_string.clear();
52     for( int c = cin.get(); 0 != c && ! cin.eof(); c = cin.get() ) {
53       file_string.push_back( c );
54     }
55     if( 0 != file_string.size() ) {
56       // Example entry
57       // type perms user group size datemodified name (7 total)
58       // f 0600 cnb cnb 424 20051015205340 ./.git/index
59       vector<string> vals = split( file_string, ' ', 7 );
60       current.insert( new FileData( vals[0][0],
61             vals[1],
62             vals[2],
63             vals[3],
64             atoi( vals[4].c_str() ),
65             atoi( vals[5].c_str() ),
66             vals[6]) );
67     }
68   } while( ! cin.eof() );
69
70   // Get the list of previously backed up files from the database.
71   sqlite3 *db;
72
73   const char *dbname = "test.db";
74   int rc = sqlite3_open( dbname, &db );
75   assert( SQLITE_OK == rc );
76
77   char *sqliteErrMsg = 0;
78   file_set backed_up;
79   rc = sqlite3_exec( db, "select * from filedata;", populate_set, &backed_up, &sqliteErrMsg );
80   assert( SQLITE_OK == rc );
81
82   rc = sqlite3_close( db );
83   assert( SQLITE_OK == rc );
84
85   // Now divide the two sets into three sets (new, deleted and updated )
86   FileDataNameCmp cmp;
87
88   file_set added;
89   set_difference( current.begin(),   current.end(),
90                   backed_up.begin(), backed_up.end(),
91                   inserter( added, added.begin() ),
92                   cmp );
93
94   file_set deleted;
95   set_difference( backed_up.begin(), backed_up.end(),
96                   current.begin(),   current.end(),
97                   inserter( deleted, deleted.begin() ),
98                   cmp );
99
100   file_set updated;
101   set_union( current.begin(),   current.end(),
102              backed_up.begin(), backed_up.end(),
103              inserter( updated, updated.begin() ),
104              cmp );
105
106   { // This little block will copy the last_backup_date from the second set to the first
107     file_set updated_mirror;
108     set_union( current.begin(),   current.end(),
109                backed_up.begin(), backed_up.end(),
110                inserter( updated_mirror, updated_mirror.begin() ),
111                cmp );
112
113     // TODO Now we need to copy the last_backup_date from 
114     file_set::iterator i = updated.begin(), j = updated_mirror.begin();
115     for( ; i != updated.end(); ++i, ++j ) {
116       (*i)->setLastBackupDate( (*j)->getLastBackupDate() );
117     }
118   }
119
120   // Now find the list of files to backup.
121   file_set backup_set;
122
123   // backup all new files
124   copy( added.begin(), added.end(), inserter( backup_set, backup_set.begin() ) );
125
126   // backup already backed-up files that have changed since the last backup date.
127   for( file_set::iterator i = updated.begin(); i != updated.end(); ++i ) {
128     if( (*i)->getLastBackupDate() < (*i)->getModifiedDate() ) {
129       backup_set.insert( *i );
130     }
131   }
132
133   // Now, sort the backup_set by filesize and build a list of up to SIZE
134   file_vector backups_bysize;
135   copy( backup_set.begin(), backup_set.end(), back_inserter( backups_bysize ) );
136   FileDataSizeCmp sizecmp;
137   sort( backups_bysize.begin(), backups_bysize.end(), sizecmp );
138
139   file_set final_set;
140   unsigned long long bytes_available = 4700000000ULL;  // 4.3 GBytes
141
142   unsigned long long block_size = 512ULL;
143
144   // Copy files over until full or out of files
145   file_vector::reverse_iterator i = backups_bysize.rbegin();
146   while( 0 != bytes_available && i != backups_bysize.rend() ) {
147     unsigned long long size = (*i)->getFileSize();
148     unsigned long long blocks = size & ( ~(block_size-1) );
149     if( blocks < size ) blocks += block_size;
150     if( blocks <= bytes_available ) {
151       bytes_available -= blocks;
152       final_set.insert( *i );
153     }
154     ++i;
155   }
156
157   // Now, sort the non-backed-up list by last_backup_date and back-fill
158   if( 0 != bytes_available ) {
159     file_vector leftovers;
160     set_difference( current.begin(),   current.end(),
161                     final_set.begin(), final_set.end(),
162                     back_inserter( leftovers ),
163                     cmp );
164
165     FileDataLastBackupCmp lastbackupcmp;
166     sort( leftovers.begin(), leftovers.end(), lastbackupcmp );
167
168     // Copy files over until full or out of files
169     file_vector::const_iterator j = leftovers.begin();
170     while( 0 != bytes_available && j != leftovers.end() ) {
171       unsigned long long size   = (*j)->getFileSize();
172       unsigned long long blocks = size & ( ~(block_size-1) );
173
174       if( blocks < size ) blocks += block_size;
175
176       if( blocks <= bytes_available ) {
177         bytes_available -= blocks;
178         final_set.insert( *j );
179       }
180       ++j;
181     }
182   }
183
184   unsigned long long now = 20051019211200ULL;
185   for( file_set::iterator k = final_set.begin(); k != final_set.end(); ++k ) {
186     (*k)->setLastBackupDate( now );
187   }
188
189   // Clean out the database
190   rc = sqlite3_exec( db, "delete from filedata;", NULL, NULL, &sqliteErrMsg );
191   assert( SQLITE_OK == rc );
192   rc = sqlite3_exec( db, "vacuum;", NULL, NULL, &sqliteErrMsg );
193   assert( SQLITE_OK == rc );
194
195   // Clean-up
196   for( file_set::iterator i = backed_up.begin(); i != backed_up.end(); ++i ) { delete *i; }
197   for( file_set::iterator i = current.begin();   i != current.end();   ++i ) { delete *i; }
198 }