<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><br class=""><div><blockquote type="cite" class=""><div class="">On 25 Jun 2015, at 17:10, Ihe Onwuka <<a href="mailto:ihe.onwuka@gmail.com" class="">ihe.onwuka@gmail.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class=""><div class="gmail_extra"><br class=""><div class="gmail_quote">On Wed, Jun 24, 2015 at 12:30 PM, Pavel Velikhov <span dir="ltr" class=""><<a href="mailto:pavel.velikhov@gmail.com" target="_blank" class="">pavel.velikhov@gmail.com</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><br class="">
A lot of people are content with MongoDB to store the JSONs. So a killer use-case needs to look beyond dumb storage of JSONs. Maybe focus on the<br class="">
preparation/transformation/cleaning/merging stuff.<br class="">
<div class=""><div class="h5"><br class=""><br class="">
><br class="">
> But the biggest factor was probably that the move to minicomputer architecture created a discontinuity that forced people to consider change. You need to do two things: convince people that the new technology is better (or at least, is cool), and give them a big kick up the backside to get them out of their comfort zone.<br class="">
><br class="">
> Michael Kay<br class="">
> Saxonica<br class="">
><br class=""></div></div></blockquote><div class=""><br class=""></div><div class=""> The data prep/transformation/cleaning/merging stuff is currently the domain of R and Python. </div></div></div></div></div></blockquote><div><br class=""></div><div>You must be talking about “data science” that is used internally in the organization. I’m talking more about data-driven Web sites, that have a big data component in their products.</div><div>In this case folks would never use R, they use all sorts of other stuff, including Python.</div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class="gmail_extra"><div class="gmail_quote"><div class=""><br class=""></div><div class="">R because thats what the statisticians like and (if you will see if you watch the R Good Bad and Ugly presentation I posted) they are not going to change. Unfortunately they are being sheepishly followed by non-statisticians. The non-statisticians who could change this - the software people - are for the most part saying I don't care if R sucks for data management and  I don't care that I am not a statistician, working with R will help me get a sexy data science job. QED.</div><div class=""><br class=""></div><div class="">With Python you have the same issue but with the additional twist that it is revered for being Swiss Army knife for devs and data scientists. This is another one of those situations where the industry inverts common sense and transforms what should ordinarily be a handicap into a virtue. </div><div class=""><br class=""></div><div class="">Ok so you go to the restaurant, place your order and they bring your food. How many of you are now going to reach into your pocket and eat it with this.</div><div class=""><br class=""></div><div class=""><a href="http://gadgether.walyou.netdna-cdn.com/wp-content/uploads/2009/11/swissarmius-main-01.jpg" class="">http://gadgether.walyou.netdna-cdn.com/wp-content/uploads/2009/11/swissarmius-main-01.jpg</a><br class=""></div><div class=""><br class=""></div><div class="">So there is a very challenging people issue to overcome</div><div class=""><br class=""></div><div class="">Technically there would need to be a streaming capability so that XQuery/JSONiq is not the part of the pipeline that barfs when fed a large dataset.</div></div></div></div></div></blockquote><div><br class=""></div><div>We’re thinking about building a JSONiq component in Scala, so it could be plugged into Spark.</div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class="gmail_extra"><div class="gmail_quote"><div class=""><br class=""></div><div class=""><br class=""></div><div class=""><br class=""></div></div></div></div>
</div></blockquote></div><br class=""><div apple-content-edited="true" class="">
<div class="">С уважением,</div><div class="">Павел Велихов</div><div class=""><a href="mailto:pavel.velikhov@gmail.com" class="">pavel.velikhov@gmail.com</a></div>
</div>
<br class=""></body></html>