en gruppe mennesker som poserer for kameraet

Recap of Cloud Stories from Norway, Episode 2: Azure IoT and Machine Learning in Oss Norge

Maxim Salnikov

Maxim Salnikov

Developer Engagement Lead

Lesetid, 7 min.

The second episode of the “Cloud stories from Norway” videoshow is ready for watching! In this 40-minutes long show we feature Azure cloud best practices, patterns, tips & tricks used in production in the products and services of the well-known Norwegian companies. 

Yo can watch this episode on-demand. Just fill in the form and you will immediately receive a link to the video in your email.

For this episode, we invited Bent Eikmo (CTO at Oss Norge AS) and Sebastien Didierjean (Data Scientist at Oss Norge AS) to present about Azure architecture decisions they made and successfully implemented to build a hardware + software + cloud solution for helping people and companies to get useful information about the power consumption in their apartments and offices. You are welcome to read about how Oss Norge uses Azure cloud for creating a greener energy market in their Customer Story on our blog.

In their short, very focused technical sessions Bent and Sebastien presented about: 

  • Technical journey on building IoT device and sending data to the cloud using Azure IoT Hub 
  • Machine Learning infrastructure used in production at scale which includes Azure Data Explorer and Databricks 
  • Many more cloud tips & tricks to skill you up on Azure! 

During the streaming session we received lots of technical questions from our attendees. Here we publish the answers to some of them: 

  • Q: Did you reduce the amount of data or only reduced the bandwidth used?
    A: We didn’t reduce the amount of data, but the amount of overhead by packing more data into a single IoT hub frame. 
  • Q: Is ADX like Google BigQuery?
    A: Yes, it is. It is more ergonomic and powerful (in our case!) 
  • Q: Is Azure Data Explorer easy to configure to ingest data from non-Azure sources, i.e Google Big Table or Big Query? Do you have any experience with that?
    A: I have limited experience of such compatibility. We use ADX for both storage and data wrangling with ingestion from IOT hub. 
  • Q: What kind of resolution are you working with on the data?
    A: We are working at seconds level. 
  • Q: Which programming language is being shown here?
    A: It is mainly KQL and python (in the sandbox) 
  • Q: Why not make all the data processing in Databricks rather than using an additional framework with ADX to do the initial predictions?
    A: Since we use ADX for the storage, it is easier to perform the first step of data wrangling/ML in ADX directly. We only use a few hours of Databricks clusters per day. 
  • Q:  Why are you doing some machine learning in Spark rather than using ADX for everything? To me this sounds like a complication.
    A: ADX is limited in term of ML and its DevOps capability is not enough to cover our needs. 
  • Q: Do you use ADX also for data storage, and how do you handle data retention?
    A: Yes, we do. We keep the last 31 days in hot (SSD) storage. 
  • Q: If I remember correctly, you also have an API that could be consumed? I assume working with electricity data, there is a lot of volume. If so, did the volume of data create any challenges in making an API?
    A: The raw data is not presented to the API. Only aggregated data is presented at the moment. 
  • Q: Could you tell what are in your experience the main advantages of doing the preprocessing in ADX vs Spark?
    A: For a little startup, ADX offers out of the box tools to perform advanced data wrangling (less coding) and the development is faster since the queries are developed directly where the data is stored. 
  • Q: How much did you reduce in cost by optimizing in total (Azure, Code and IoT)
    A: It is hard to say because we are not completely done optimizing, but I would say about 70% 
  • Q: How do you store the archive data in Azure?
    A: We are not moving data to additional archive storage at the moment. 
  • Q: Do you have a solution for including the different grid tarifs (nettleie) when presenting the costs/price of the consumed electricity to each user?
    A: We consider the zones where the customer lives. Considering the exact grid tariffs is under development. 
  • Q: For how long do you keep the data? Is it deleted afterwards or archived somewhere else?
    A: As long as the user is a customer, we keep the data in our system (ADX)! 
  • Q: Could a machine learning model trained in AzureML be used directly in ADX to achieve the same capability as SparkML?
    A: I am a bit unsure about the level of performance (it depends on the cluster configs/costs) but a model trained with AzureML should work with the Python sandbox. Let me know if you manage to couple ADX and AzureML! 
  • Q: Is data is stored as JSON?
    A: It is ADX that deals with it. It looks JSON like. 
  • Q: Do you push code to the devices as well with IoT Hub?
    A: Yes, we are using IoT Hub to control the update process. 
  • Q: Have you considered the life of Data? How long the data is planned to be stored?
    A: As long as a user remains a customer, we do not have any limit on storage based on how old the data is. 
  • Q: I understand that customers’ anticipation and awareness might be one the goals but what is the future for Oss Norge and its product?
    A: As of today, Oss Norge addresses both private and business markets with products oriented towards energy prediction and awareness. We are working on improving the present developments and on the optimisation of energy savings in the business segment with highly competitive solutions.   
  • Q: Could you provide some thoughts on what types of workloads you would use ADX and Databricks for going forward, in both the data engineering and machine learning areas? ADX seems to be very effective for less complex stuff (simple data transformation, basic built-in ML?), whereas Databricks provides full flexibility (and, perhaps, added scalability). Do you also see it this way, and if so, where would you say that you hit that «complexity threshold» on data engineering and ML complexity where Databricks becomes more effective?
    A: So far ADX is scaling very smoothly so we do not think about Databricks overtaking part of the ETL. The presence of the python sandbox in ADX makes it flexible enough to cope with our future developments. 
  • Q: How did Azure help you in ensuring Data quality?
    A: I would say that it is one of our first mission as Data Scientist to ensure optimal Data Quality. ADX with the built-in visualisation tool helps in productivity for all the tasks related to Data Quality. 
  • Q: Do you delete the data after some time or archive it in some way (e.g. so that you can perform long term analysis later)?
    A: All data is stored within ADX at the moment for later analysis. 

How to contact Bent Eikmo: 

 How to contact Sebastien Didierjean: 

All episodes of the “Cloud stories from Norway”

Next events from Microsoft Norway?

How to follow all Microsoft Norway’s and local tech communities’ events about Azure cloud for the developers – conferences, seminars, workshops, training, webinars, etc.? Just follow our technical twitter https://twitter.com/MSDevNo or hashtag #MSDevNo

To stay connected: 

Feel free to send your questions about the Azure cloud technology and educational events here: maxim.salnikov@microsoft.com 

Maxim Salnikov
Developer Engagement Lead at Microsoft Norway 

Gratis E-bok: Are you ready for the Modern Workforce

Skap arbeidsplasser som engasjerer og inspirerer medarbeiderne

Gratis whitepaper: Hvordan teknologi hjelper bedrifter med å få fullt utbytte av ideer

Skap et bedre arbeidsmiljø der de ansatte har utstyr og muligheter til å generere nye ideer

Oppdag flere relaterte artikler per bransje:

Detaljhandel

Helseomsorg

  • logo

    Derfor er tillit den viktigste ingrediensen i digital transformasjon innen helsesektoren.

    Telefonen min hadde nesten ringt ustanselig i ukevis, og nå ringte den igjen. «Veronica», sa stemmen i den andre enden, «vi har fått en idé!» Jeg hørte straks hvem det var. Jeg har kjent Carlo Tacchetti nesten like lenge som jeg har jobbet hos Microsoft. Han er professor ved universitetet Vita-Salute San Raffaele og direktør […]

  • Helsetjenester hjemmefra

    Helsetjenester hjemmefra

    Verden har opplevd en bratt læringskurve de siste ukene, særlig innenfor helsesektoren. Hva kan vi lære av førstelinjearbeiderne fra denne perioden, og hvordan vil fremtidens helsevesen se ut? Vi tror teknologi vil bli en av bærebjelkene i fremtidens helse og omsorgssektor En tredjedel av alle europeere lever med en kronisk sykdom*, og for disse er […]

Industri

  • Azure Skills2

    Knowledge Mining – Uncover Latent Insights within Your Organization

    Thank you for joining us at Knowledge Mining – Uncover Latent Insights within Your Organization! The video is available on demand, and you can watch it at any time here    If you would like to reach one of our speakers:  Izabela Hawrylko, Data & AI Specialist at Microsoft  https://www.linkedin.com/in/izabelahawrylko/   Izabela.Hawrylko@microsoft.com   Ignacio Floristan, Global Black Belt AI Specialist […]

  • en person som sitter ved et skrivebord med en bærbar PC på et bord

    Hvordan tilrettelegge for dine ansatte i usikre tider

    Microsofts Max Tchapeyou tilbyr et veldig personlig synspunkt, med henvisning til de seks måtene han har funnet for å jobbe mer effektivt – og positivt – med teamet sitt.

Offentlig sektor

  • Sikker datalagring på norsk jord

    Sikker datalagring på norsk jord

    Høsten 2019 åpner Microsoft to nye datasenterregioner i Norge. Datasentrene tilbyr skytjenester til offentlige og private aktører med behov for og krav til lagring av data på norsk jord. Informasjonssikkerhet er helt nødvendig for alle verdiskapende aktører i vårt moderne samfunn. Når stadig flere avgjørelser baseres på en voksende mengde tilgjengelig informasjon, må vi kunne […]

  • Iceland runs on Trust

    Hvordan skyen hjalp en liten nasjon med å realisere store ambisjoner

    I desember 2015 startet den islandske regjeringen en gjennomgang av den digitale infrastrukturen. Med mer enn 100 forskjellige leverandører som administreres av over 100 IT-ledere i hver offentlig institusjon, var oppdraget klart: å forenkle driften og effektivisere IT for over 20 000 brukere. Løsningen: Etter to og et halvt år ble en beslutning tatt: For første […]

Utdanning

  • Effektiv blandet læring med Microsoft Teams

    Effektiv blandet læring med Microsoft Teams

    COVID-19 har hatt stor innvirkning på dagene til millioner av lærere og elever over hele verden. Microsoft Education-teamet har vært opptatt av å hjelpe alle med å holde kontakten og holde engasjementet oppe gjennom fjernundervisning. Og nå, når land etter land begynner å komme ut av krisen, hjelper Microsoft skoler med å gå over til […]

  • Skolens GDPR-guide 

    Skolens GDPR-guide 

    Skolens GDPR-guide Etter 25. mai* må du forholde deg til EUs regler rundt General Data Protection Regulation (GDPR). For å forstå hvordan din skole skal klare dette, kan du ta en titt på denne e-boken og andre ressurser som kan være nyttig for deg og skolen din. Din skoles reise Skolen samler inn navn, adresser, fødselsdatoer […]

Oppdag flere relaterte artikler per dossier:

Digital Transformation

Kundehistorier

Presse

  • Microsoft Norges respons til COVID-19

    Microsoft Norges respons til COVID-19

    Sist oppdatert: 16. mars 2020 Microsoft har en global tilnærming til beredskapsplaner og planlegging av krisehåndtering, som inkluderer både forutsette og uforutsette hendelser. Tilnærmingen inkluderer en handlingsplan ved pandemier. Våre handlingsplaner aktiveres over hele verden, og i tillegg til bistandsmidler til Kina og Puget Sound Community, har vi forpliktet oss til å levere produkter, tjenester […]

Sikkerhet og personvern

Tips