You&#39;re right. Even if I partition my data (say 2 gb chunks) I&#39;m probably not that much faster than disk. (based on robby&#39;s data)<br>I think I better start reading the ports library docs. (or stick to document sets &lt;100mb)<br>
<br>s.<br><br><br><div class="gmail_quote">On Tue, Nov 4, 2008 at 7:28 PM, Eli Barzilay <span dir="ltr">&lt;<a href="mailto:eli@barzilay.org" target="_blank">eli@barzilay.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

<div>On Nov &nbsp;4, Stephen De Gabrielle wrote:<br>
&gt; I&#39;m working with the Enron email collection, uncompressed it is 2.54<br>
&gt; Gb(across 500k files) , so it should be possible to play with the<br>
&gt; whole thing in RAM.<br>
<br>
</div>Just in case you plan to actually do that: at these sizes multipler<br>
factors become things that you should be aware of:<br>
<br>
* In general, the GC requires more memory than you actually use. &nbsp;I<br>
 &nbsp;think that generally speaking you should plan on it holding twice<br>
 &nbsp;the ram that you actually need. &nbsp;(Even though it can be smaller with<br>
 &nbsp;generations.)<br>
<br>
* MzScheme holds strings in UCS-4 format, so each character is 4<br>
 &nbsp;bytes.<br>
<br>
In other words, you might need around 20gb of ram just to read it all<br>
in.<br>
<div><br>
--<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;((lambda (x) (x x)) (lambda (x) (x x))) &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Eli Barzilay:<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://www.barzilay.org/" target="_blank">http://www.barzilay.org/</a> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Maze is Life!<br>
_________________________________________________<br>
</div><div><div></div><div> &nbsp;For list-related administrative tasks:<br>
 &nbsp;<a href="http://list.cs.brown.edu/mailman/listinfo/plt-scheme" target="_blank">http://list.cs.brown.edu/mailman/listinfo/plt-scheme</a><br>
</div></div></blockquote></div><br>