<div dir="ltr"><br><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><br><div><br></div></div></div></div>
<br><div>On Thu, Jan 8, 2015 at 4:56 PM, Thomas Wetmore <span dir="ltr"><<a href="mailto:ttw4@verizon.net" target="_blank">ttw4@verizon.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><span class=""><br>
> On Jan 8, 2015, at 7:14 PM, Louis Kessler <<a href="mailto:lkessler@LKESSLER.COM">lkessler@LKESSLER.COM</a>> wrote:<br>
><br>
> Jan Murphy said:<br>
>> Are you defining census households by using the heads of households as delineators?  That is treacherous<br>
>> because I've seen many instances where people are not written neatly within their own family group, e.g.<br>
>> p1 = uncle p2 = head and so on.<br>
>><br>
>> This is one of many reasons I would rather see the breakdown of raw data done by source, and instead of<br>
>> a p for person have an e = entry number for the line on the document.<br>
><br>
> As you describe, Jan, is exactly the way I would do it. I have stated that the source should contain "just the facts" and no interpretation. Assuming the personas is interpretation.<br>
<br>
</span>Does this mean that you and Jan both think that the concept of the household is too “interpreted” to use as a basis in extracting raw data from a census? If you check censuses that organize by household you will find that almost all of them give each household a specific index number, and keep them grouped by those numbers. Isn’t that data indexing part of the raw source data?<br>
<br>
You could treat that family index as another field/column for each person, but that’s just the same effect that I’m after with a slightly different organization. Are you saying the household is not a useful concept? If you think it is a useful concept, how would you handle it?<br>
<br>
When you are doing research and extracting data from a census, do you extract the data for every person on the page with your family of interest, or do you just extract the data for the family of interest? Or do you do something between the two, maybe extract nearby by families that you think might prove of interest eventually.<br>
<br>
Just think about what it would mean to extract “just the facts” from a census as a source. Wow.<br>
<br>
If you have an event with a date, and the age of a person at that date, you can estimate the person’s birth to plus or minus a year or two. Would you call that interpreted data? Or would you call it just another form of the provided information? Would you include that estimated birth year anywhere? Or would you expect software to infer it when appropriate? If you were to include that estimated birth year anywhere, where would that be?<br>
<span class=""><br>
> This small difference in thinking is the thing I don’t like about Tom's ideas of personas, because I think of personas as mini-conclusions not belonging with the source data.<br>
<br>
</span>Given that you don’t like it at the persona level, do you like it anywhere else instead?<br><div class=""><div></div></div></blockquote><div><br></div><div>Bearing in mind that we are talking about RAW data here....<br><br>If I say <br><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">Archive reference     RG11<br>Piece number     2180<br>Folio     67</blockquote><div></div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">Page     3 <br></blockquote></div><div><br></div><div>and I say I am looking at line 9, then any genealogist in the UK knows exactly which person is meant, without any ambiguity.  <br><br></div><div>Tom said: <br><br></div><div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">If you check censuses that organize by household you will find that 
almost all of them give each household a specific index number, and keep
 them grouped by those numbers. Isn’t that data indexing part of the raw
 source data?</blockquote><div><br></div><div>Yes indeed, but in the cases where the census does not include dwelling numbers and family numbers, then the only cross-check we have if a boundary goes awry is to also know the number of the entry on the page, and if there is no printed line number on the census form, then there should be some way of preserving the position of the entry on the page. <br><br></div><div>I have seen cases on Ancestry where the choice to view "all people on this page" results in a display which puts all the name in alphabetical order.  <br><br></div>There have also been cases where published petitions disregarded the order of the names on the sheets and published the names every which way (Elizabeth, was that one of your presentations?), thus making the printed form useless for figuring out which people were actually 'nearby'.<br><br></div><div>I hate to keep arguing this point over and over again, but we are looking at documents and other source material.  We are not looking at people.  We are looking at sources, most of which (but not all) contain names.  <br><br></div><div>A lot of beginning researchers, including many of the people in the Genealogy Do-Over group, struggle to learn how to cite their sources, and why? Because if you work in a people-centric system the sources are always an afterthought.<br><br></div>Jan Murphy<br></div><a href="mailto:packrat74@gmail.com" target="_blank">packrat74@gmail.com</a></div></div>