DeepSeek-R1 kombinerar AI och Edge Computing för industriell IoT

Introduktion

De små destillerade modellerna av DeepSeek-R1 finjusteras med hjälp av tankekedjans data som genereras av DeepSeek-R1, markerade med...taggar, som ärver resonemangsförmågorna från R1. Dessa finjusterade datamängder inkluderar explicit resonemangsprocesser som problemupplösning och mellanliggande deduktioner. Förstärkningsinlärning har anpassat den destillerade modellens beteendemönster till de resonemangssteg som genereras av R1. Denna destillationsmekanism gör det möjligt för små modeller att bibehålla beräkningseffektivitet samtidigt som de erhåller komplexa resonemangsförmågor nära de hos större modeller, vilket är av betydande tillämpningsvärde i resursbegränsade scenarier. Till exempel uppnår 14B-versionen 92 % av kodkompletteringen jämfört med den ursprungliga DeepSeek-R1-modellen. Den här artikeln introducerar den destillerade DeepSeek-R1-modellen och dess kärntillämpningar inom industriell edge computing, sammanfattad i följande fyra riktningar, tillsammans med specifika implementeringsfall:

dc3c637c5bead8b62ed51b6d83ac0b4

Förebyggande underhåll av utrustning

Teknisk implementering

Sensorfusion:

Integrera vibrations-, temperatur- och strömdata från PLC:er via Modbus-protokollet (samplingsfrekvens 1 kHz).

Funktionsutvinning:

Kör Edge Impulse på Jetson Orin NX för att extrahera 128-dimensionella tidsseriefunktioner.

Modellinferens:

Distribuera DeepSeek-R1-Distill-14B-modellen och mata in funktionsvektorer för att generera värden för felsannolikhet.

Dynamisk justering:

Utlös underhållsarbetsordrar när konfidensen är > 85 % och initiera en sekundär verifieringsprocess när den är < 60 %.

Relevant fall

Schneider Electric använde den här lösningen på gruvmaskiner, vilket minskade antalet falska positiva resultat med 63 % och underhållskostnaderna med 41 %.

1

Köra DeepSeek R1 Distilled Model på InHand AI Edge-datorer

Förbättrad visuell inspektion

Utdataarkitektur

Typisk distributionspipeline:

kamera = GigE_Vision_Camera(500fps) # Gigabit industrikamera
frame = camera.capture() # Ta bild
förbearbetad = OpenCV.denoise(frame) # Brusreducering förbehandling
defect_type = DeepSeek_R1_7B.infer(förbearbetad) # Felklassificering
om defekttyp != 'normal':
PLC.trigger_reject() # Triggersorteringsmekanism

Prestandamätningar

Bearbetningsfördröjning:

82 ms (Jetson AGX Orin)

Noggrannhet:

Detektering av defekter vid formsprutning når 98,7 %.

2

DeepSeek R1:s implikationer: Vinnare och förlorare i den generativa AI-värdekedjan

Processflödesoptimering

Viktiga teknologier

Naturlig språkinteraktion:

Operatörer beskriver utrustningens avvikelser via röst (t.ex. "Extrudertryckfluktuation ±0,3 MPa").

Multimodalt resonemang:

Modellen genererar optimeringsförslag baserat på utrustningens historiska data (t.ex. justering av skruvhastigheten med 2,5 %).

Verifiering av digital tvilling:

Validering av parametersimulering på EdgeX Foundry-plattformen.

Implementeringseffekt

BASFs kemiska anläggning antog detta system och uppnådde en minskning av energiförbrukningen med 17 % och en ökning av produktkvaliteten med 9 %.

3

Edge AI och framtidens affärsvärld: OpenAI o1 vs. DeepSeek R1 för sjukvård, fordonsindustrin och IIoT

Omedelbar hämtning av kunskapsbasen

Arkitekturdesign

Lokal vektordatabas:

Använd ChromaDB för att lagra utrustningsmanualer och processspecifikationer (inbäddningsdimension 768).

Hybridåtervinning:

Kombinera BM25-algoritmen + cosinuslikhet för frågan.

Resultatgenerering:

R1-7B-modellen sammanfattar och förfinar hämtningsresultaten.

Typfall

Siemens ingenjörer löste växelriktarfel genom frågor på naturligt språk, vilket minskade den genomsnittliga bearbetningstiden med 58 %.

Utmaningar och lösningar vid implementering

Minnesbegränsningar:

Använde KV Cache-kvantiseringsteknik, vilket minskade minnesanvändningen för 14B-modellen från 32 GB till 9 GB.

Säkerställa prestanda i realtid:

Stabiliserad latens för enstaka inferenser till ±15 ms genom CUDA Graph-optimering.

Modelldrift:

Veckovisa stegvisa uppdateringar (överför endast 2 % av parametrarna).

Extrema miljöer:

Utformad för brett temperaturområde från -40 °C till 85 °C med skyddsnivå IP67.

5
微信图片_20240614024031.jpg1

Slutsats

Nuvarande driftsättningskostnader har nu minskat till 599 USD/nod (Jetson Orin NX), med skalbara applikationer som utvecklas inom sektorer som 3C-tillverkning, fordonsmontering och energikemi. Kontinuerlig optimering av MoE-arkitekturen och kvantiseringstekniken förväntas göra det möjligt för 70B-modellen att köras på edge-enheter i slutet av 2025.

Hitta ELV-kabellösning

Kontrollkablar

För BMS, BUS, industri och instrumentkabel.

Strukturerat kabelsystem

Nätverk och data, fiberoptisk kabel, patchkabel, moduler, frontplatta

Översikt över utställningar och evenemang 2024

16-18 april 2024 Mellanöstern-Energi i Dubai

16-18 april 2024 Securika i Moskva

9 maj 2024 LANSERING AV NYA PRODUKTER OCH TEKNOLOGIER i Shanghai

22-25 oktober 2024 SECURITY CHINA i Peking

19-20 november 2024 CONNECTED WORLD KSA


Publiceringstid: 7 februari 2025