Unfortunately, the automatic garbage collection is important because of the shared structure - slices, transposes, reshapes, etc. share the content vector with the parent. They should never be circular, so a reference count method might work. But, it may not worth it.<br>
<br>At some point we would have to do the boxing to get results to/from Scheme code.<br><br><div class="gmail_quote">On Thu, Aug 13, 2009 at 9:35 PM, Robby Findler <span dir="ltr">&lt;<a href="mailto:robby@eecs.northwestern.edu">robby@eecs.northwestern.edu</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">If you were careful to allocate these big blobs in special places,<br>
could you use the address itself as a tag (I think that&#39;s what the<br>
bebob collectors do) and avoid the extra boxing?<br>
<br>
Robby<br>
<div><div></div><div class="h5"><br>
On Thu, Aug 13, 2009 at 10:24 PM, Doug<br>
Williams&lt;<a href="mailto:m.douglas.williams@gmail.com">m.douglas.williams@gmail.com</a>&gt; wrote:<br>
&gt; Eli,<br>
&gt;<br>
&gt; Thanks for the info. It&#39;s all useful and I put some trivial comments in-line<br>
&gt; below.<br>
&gt;<br>
&gt; Doug<br>
&gt;<br>
&gt;&gt; * However, if you&#39;re doing a lot of work *inside* Scheme, then things<br>
&gt;&gt;  can become very inefficient.  For example, say that you want to loop<br>
&gt;&gt;  over a floating point array and multiply all of the values by a<br>
&gt;&gt;  given factor.  What will happen in this case is: each time you read<br>
&gt;&gt;  a value, you allocate a Scheme object for the fp number, multiplying<br>
&gt;&gt;  that allocates a new one, then saving it copies the result back to<br>
&gt;&gt;  the array, leaving the two allocated values to be GCed.  (There are<br>
&gt;&gt;  some JIT-level optimizations for fp numbers, I don&#39;t know if it can<br>
&gt;&gt;  save one of these allocations in this case.)<br>
&gt;<br>
&gt; My plan would be to do the work inside of Scheme - at least for now. It<br>
&gt; would be interesting to see if there are some JIT optimizations planned for<br>
&gt; the future that could help.<br>
&gt;<br>
&gt;&gt;<br>
&gt;&gt; * Another point to consider is huge arrays -- if you expect to have<br>
&gt;&gt;  such arrays, then it might be better to do the allocation explicitly<br>
&gt;&gt;  outside of the GC -- using `malloc&#39; in &#39;raw mode.  This will require<br>
&gt;&gt;  registering finalizers to free them, but the benefits are:<br>
&gt;&gt;  - You can have a huge array without worrying about the 3m GC that<br>
&gt;&gt;    usually requires double the space that you&#39;re using.<br>
&gt;&gt;  - Dealing with an external library that allocates an array becomes<br>
&gt;&gt;    easy, since it&#39;s dealt with in the same way.<br>
&gt;&gt;  - No issues with arrays moving around, for external code that keeps<br>
&gt;&gt;    pointers to it.  (I can imagine this being a real benefit if there<br>
&gt;&gt;    are libraries that can use multiple cores and calling a callback<br>
&gt;&gt;    function when the operation is done.)<br>
&gt;<br>
&gt; Some applications would use large arrays.<br>
&gt;<br>
&gt;&gt;<br>
&gt;&gt; * Finally, it sounds like it might be more convenient to use the<br>
&gt;&gt;  `cvector&#39; representation from the foreign interface: this is very<br>
&gt;&gt;  similar to the srfi-4 representation, except that the type is stored<br>
&gt;&gt;  in the cvector rather than having a separate type for each kind of<br>
&gt;&gt;  vector.<br>
&gt;<br>
&gt; I&#39;ll look into it. I already wrote a typed-vector abstraction on top of SFRI<br>
&gt; 4 (and normal Scheme vectors), so that isn&#39;t an issue for now.<br>
&gt;<br>
&gt;<br>
&gt;<br>
</div></div>&gt; _________________________________________________<br>
&gt;  For list-related administrative tasks:<br>
&gt;  <a href="http://list.cs.brown.edu/mailman/listinfo/plt-scheme" target="_blank">http://list.cs.brown.edu/mailman/listinfo/plt-scheme</a><br>
&gt;<br>
&gt;<br>
</blockquote></div><br>