<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jun 24, 2015 at 12:30 PM, Pavel Velikhov <span dir="ltr"><<a href="mailto:pavel.velikhov@gmail.com" target="_blank">pavel.velikhov@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><br>
A lot of people are content with MongoDB to store the JSONs. So a killer use-case needs to look beyond dumb storage of JSONs. Maybe focus on the<br>
preparation/transformation/cleaning/merging stuff.<br>
<div class=""><div class="h5"><br><br>
><br>
> But the biggest factor was probably that the move to minicomputer architecture created a discontinuity that forced people to consider change. You need to do two things: convince people that the new technology is better (or at least, is cool), and give them a big kick up the backside to get them out of their comfort zone.<br>
><br>
> Michael Kay<br>
> Saxonica<br>
><br></div></div></blockquote><div><br></div><div> The data prep/transformation/cleaning/merging stuff is currently the domain of R and Python. </div><div><br></div><div>R because thats what the statisticians like and (if you will see if you watch the R Good Bad and Ugly presentation I posted) they are not going to change. Unfortunately they are being sheepishly followed by non-statisticians. The non-statisticians who could change this - the software people - are for the most part saying I don't care if R sucks for data management and  I don't care that I am not a statistician, working with R will help me get a sexy data science job. QED.</div><div><br></div><div>With Python you have the same issue but with the additional twist that it is revered for being Swiss Army knife for devs and data scientists. This is another one of those situations where the industry inverts common sense and transforms what should ordinarily be a handicap into a virtue. </div><div><br></div><div>Ok so you go to the restaurant, place your order and they bring your food. How many of you are now going to reach into your pocket and eat it with this.</div><div><br></div><div><a href="http://gadgether.walyou.netdna-cdn.com/wp-content/uploads/2009/11/swissarmius-main-01.jpg">http://gadgether.walyou.netdna-cdn.com/wp-content/uploads/2009/11/swissarmius-main-01.jpg</a><br></div><div><br></div><div>So there is a very challenging people issue to overcome</div><div><br></div><div>Technically there would need to be a streaming capability so that XQuery/JSONiq is not the part of the pipeline that barfs when fed a large dataset.</div><div><br></div><div><br></div><div><br></div></div></div></div>