mrDarker
2025-07-24 27b45f7dd911640b4c8fefe6e060fc35a1f98e6e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
 
 
 
 
.data
 
astPair    STRUCT
    pos        dword ?
    pair    dword ?
    dtype    dword ?
    peak    dword ?
    x        dword ?
    y        dword ?
    src        dword ?
    ref        dword ?
    zone    dword ?
    Thre    dword ?    
astPair    ENDS
 
 
.code
 
InspLeft        equ        qword ptr[rbp+ 30h]
InspRight        equ        qword ptr[rbp+ 38h]
InspTop        equ        qword ptr[rbp+ 40h]
InspBottom        equ        qword ptr[rbp+ 48h]
 
DefectX        equ        qword ptr[rbp+ 50h]
DefectY        equ        qword ptr[rbp+ 58h]
DefectType    equ        qword ptr[rbp+ 60h]
DefectVal    equ        qword ptr[rbp+ 68h]
 
 
BuffWidth    equ        qword ptr[rbp+ 70h]
iPitch        equ        qword ptr[rbp+ 78h]
fSPR        equ        qword ptr[rbp+ 80h]
sSPR        equ        qword ptr[rbp+ 88h]
 
Threshold    equ        qword ptr[rbp+ 90h]
Suppress    equ        qword ptr[rbp+ 98h]
SPR            equ        qword ptr[rbp+ 0a0h]
ShiftCnt    equ        qword ptr[rbp+ 0a8h]
 
iPitch2    equ        qword ptr[rbp+ 0b0h]
fSPR2        equ        qword ptr[rbp+ 0b8h]
sSPR2        equ        qword ptr[rbp+ 0c0h]
 
ix            equ        rcx
iy            equ        rdx
 
rrImgAddr    equ        rsi
rrNDefect    equ        rdi
 
 
rrPeakFlag        equ        r8
rrBuffWidth    equ        r9
rrdx        equ        r10
rrdy        equ        r11
rrdt        equ        r12
rrdp        equ        r13
 
 
rrConAddr    equ        r15
 
 
xxTemp        equ        xmm1
 
xxPlus2    equ        xmm8
xxMinus2    equ        xmm9
 
xxSrc        equ        xmm4
xxCmp        equ        xmm5
xxMinus    equ        xmm6
xxPlus        equ        xmm7
 
xxPeak        equ        xmm2
xxPeak2    equ        xmm3
 
xxfSPR        equ        xmm10
xxsSPR        equ        xmm11
xxfSpr2    equ        xmm14
xxsSpr2    equ        xmm15
xxThres    equ        xmm12
xxSupp        equ        xmm13
 
 
 
lShiftCnt    equ        4
 
ConvVert2 PROC
    local    ImgAddr        : qword        ; ÆÄ¶ó¹ÌÅͷΠ³Ñ¾î¿Â °ª
    local    ImgAddrLeft    : qword
    local    ImgConLine        : qword        ; Conv Buffer ¸¸µé¶§ ½ÃÀÛ ÁÖ¼Ò
    local    F_Y2Insp        : qword
    local    ShftSize        : qword
    local    maxDefect        : qword
    local    ConPitch        : qword    ; 8*iPitch
    local    ConPitch2        : qword
    local    ConvSize        : qword
    local    ConAddr        : qword
    local    ConOrigin        : qword
    local    InspTop1        : qword
    local    InspTop2        : qword
    
 
 
    push    rbp
    mov        rbp, rsp
    push    r10
    push    r11
    push    r12
    push    r13
    push    r14
    push    r15
    push    rdi
    push    rsi
    push    rbx
    ADD        rbp, 070h
 
 
    mov        ConvSize, 4
    mov        rax, ShiftCnt
    mov        ShftSize, 4
 
; ÆÄ¶ó¹ÌÅͷΠ³Ñ¾î¿Â register°ª ¿Å±â±â
    mov        ImgAddr        , rcx
    mov        ConOrigin        , rdx
    mov        maxDefect    , r8
    mov        rrNDefect    , r9
;    sub        maxDefect, 16
 
 
; mmx °ª ¸¸µé±â
    mov            rax, Suppress
    mul            SPR
    mul            ConvSize
    movd        xxSupp, rax        ; supress
    movdqa        xmm0, xxSupp
    punpcklwd    xmm0, xxSupp
    pshufd        xxSupp, xmm0, 0
    
    
    mov            rax, Threshold
    movd        xxThres, rax        ; Threshold
    movdqa        xmm0, xxThres
    punpcklwd    xmm0, xxThres
    pshufd        xxThres, xmm0, 0
 
    movd        xxfSPR, fSpr        ; fSpr
    movdqa        xmm0, xxfSPR
    punpcklwd    xmm0, xxfSPR
    pshufd        xxfSPR, xmm0, 0
 
    movd        xxsSPR, sSpr        ; sSpr
    movdqa        xmm0, xxsSPR
    punpcklwd    xmm0, xxsSPR
    pshufd        xxsSPR, xmm0, 0
 
 
    movd        xxfSPR2, fSpr2        ; fSpr
    movdqa        xmm0, xxfSPR2
    punpcklwd    xmm0, xxfSPR2
    pshufd        xxfSPR2, xmm0, 0
 
    movd        xxsSPR2, sSpr2        ; sSpr
    movdqa        xmm0, xxsSPR2
    punpcklwd    xmm0, xxsSPR2
    pshufd        xxsSPR2, xmm0, 0
 
 
; register ÇÒ´ç.
    mov        ix, InspLeft
    mov        iy, InspTop
 
    mov        rrdx, DefectX
    mov        rrdy, DefectY
    mov        rrdt, DefectType
    mov        rrdp, DefectVal
    mov        rrBuffWidth, BuffWidth
 
 
 
 
; °Ë»ç ¿µ¿ª ¼³Á¤(width¸¦ pitch¸¸Å­ Àß¶ó¾ß ºñ±³ÇÑ´Ù)
; ÁÖ¼Ò°ª ¼³Á¤
 
    mov        rax, rrBuffWidth
    mul        InspTop
    add        rax, ImgAddr
    add        rax, ix
    mov        ImgAddrLeft, rax
    
    mov        rax, 20h
    mul        InspTop
    add        rax, ConOrigin
    mov        ConAddr, rax
 
 
 
    mov        rax, InspRight
    sub        rax, InspLeft
    sar        rax, 4
    sal        rax, 4
    add        rax, InspLeft
    mov        InspRight, rax        ; ½ÇÁ¦ °Ë»ç ¿µ¿ª ³¡ÁöÁ¡ º¯°æ(8 byte align)
 
    mov        rax, 20h
    mul        iPitch
    mov        ConPitch, rax
    
    mov        rax, 20h
    mul        iPitch2
    mov        ConPitch2, rax
 
    mov        rax, InspTop
    add        rax, iPitch
    add        rax, 2
    mov        InspTop1, rax
    
    mov        rax, InspBottom
    sub        rax, iPitch
    sub        rax, 2
    mov        InspTop2, rax
 
 
    pxor    xmm0, xmm0    
    mov        iy, InspTop
    sub        ImgAddrLeft, 10h
 
 
LOOP_X:
    cmp        ix, InspRight
    jge        LOOP_X_END
    
    add        ImgAddrLeft, 10h
    mov        rrImgAddr, ImgAddrLeft
    mov        rrConAddr, ConAddr
    
    mov        iy, InspTop
 
; ÀӽàConbuff
;    mov        rrImgAddr, ImgAddr
;    add        rrImgAddr, ix
;    mov        rrConAddr, ConOrigin
;    mov        iy, 0
; ÀӽàConbuff
 
; Con ¹öÆÛ ¸¸µé±â
LOOP_Y_CON_BUFF:
    movdqu        xxSrc, [rrImgAddr]
    movdqa        xxCmp, xxSrc
    punpcklbw    xxSrc, xmm0
    punpckhbw    xxCmp, xmm0
 
    movdqu        xxPlus, [rrImgAddr+ 1]
    movdqa        xxMinus, xxPlus
    punpcklbw    xxPlus, xmm0
    punpckhbw    xxMinus, xmm0
 
    paddw        xxSrc, xxPlus
    paddw        xxCmp, xxMinus
    movdqu        [rrConAddr], xxSrc
    movdqu        [rrConAddr+ 10h], xxCmp
    
    add        rrImgAddr, rrBuffWidth
    add        rrConAddr, 20h
 
    inc        iy
    cmp        iy, InspBottom
    jle        LOOP_Y_CON_BUFF
 
 
    mov        rrConAddr, ConAddr
    mov        iy, InspTop
    mov        F_Y2Insp, 0
 
LOOP_Y:
    cmp        iy, InspBottom
    jge        LOOP_Y_END
 
    cmp        rrNDefect, maxDefect
    jge        End_Buffer
 
 
; ¼Ò½º ¹öÆÛ
    movdqu    xxSrc, [rrConAddr]
    movdqu    xxTemp, [rrConAddr+ 20h]
    paddw    xxSrc, xxTemp
    psllw    xxSrc, lShiftCnt
 
    movdqa        xxTemp, xxSrc                ; suppress (2*2*SPR ÇØÁØ suppress)
    psubusw    xxTemp, xxSupp
    psubusw    xxSrc, xxTemp
 
 
    cmp        iy, InspTop2
    jg        CaseCmpTop3
 
; ºñ±³ ¹öÆÛ ÇÕ ¸¸µé±â
    mov        rax, rrConAddr
    add        rax, ConPitch
 
    movdqu    xxCmp, [rax]
    pmullw    xxCmp, xxfSPR
 
    movdqu    xxTemp, [rax+ 20h]
    psllw    xxTemp, lShiftCnt
    paddw    xxCmp, xxTemp
    
    movdqu    xxTemp, [rax+ 40h]
    pmullw    xxTemp, xxsSPR
    paddw    xxCmp, xxTemp
 
    jmp        CaseCmpEnd
 
CaseCmpTop3:
    mov        rax, rrConAddr
    sub        rax, ConPitch
    
    movdqu    xxCmp, [rax+ 20h]
    pmullw    xxCmp, xxfSPR
    
    movdqu    xxTemp, [rax]
    psllw    xxTemp, lShiftCnt
    paddw    xxCmp, xxTemp
    
    movdqu    xxTemp, [rax- 20h]
    pmullw    xxTemp, xxsSPR
    paddw    xxCmp, xxTemp
 
 
CaseCmpEnd:
    movdqa        xxTemp, xxCmp                ; suppress (2*2*SPR ÇØÁØ suppress)
    psubusw    xxTemp, xxSupp
    psubusw    xxCmp, xxTemp
 
 
    movdqa    xxMinus    , xxCmp
    psubusw    xxMinus    , xxSrc
    movdqa    xxPlus    , xxSrc
    psubusw    xxPlus    , xxCmp
 
Inspect_Black:
    movdqa        xxPeak, xxMinus
    pcmpgtw    xxPeak, xxThres
    pmovmskb    rax, xxPeak
 
Inspect_White:
    movdqa        xxPeak2, xxPlus
    pcmpgtw    xxPeak2, xxThres
    pmovmskb    rbx, xxPeak2
    add        rax, rbx
    cmp        rax, 0
    je        Defect_None
 
    cmp        iy, InspTop2
    jg        CaseCmp2Top3
 
    cmp        iy, InspTop1
    jg        CaseCmp2Top2
    
; °áÇÔ °ËÁõ
 
CaseCmp2Top1:
    mov        rax, rrConAddr
    add        rax, ConPitch2
 
    movdqu    xxCmp, [rax]
    pmullw    xxCmp, xxfSPR2
 
    movdqu    xxTemp, [rax+ 20h]
    psllw    xxTemp, lShiftCnt
    paddw    xxCmp, xxTemp
 
    movdqu    xxTemp, [rax+ 40h]
    pmullw    xxTemp, xxsSPR2
    paddw    xxCmp, xxTemp
 
    jmp        Inspect_Black2
 
CaseCmp2Top2:
    mov        rax, rrConAddr
    sub        rax, ConPitch
 
    movdqu    xxCmp, [rax+ 20h]
    pmullw    xxCmp, xxfSPR
 
    movdqu    xxTemp, [rax]
    psllw    xxTemp, lShiftCnt
    paddw    xxCmp, xxTemp
 
    movdqu    xxTemp, [rax- 20h]
    pmullw    xxTemp, xxsSPR
    paddw    xxCmp, xxTemp
 
    
    jmp        Inspect_Black2
 
CaseCmp2Top3:
    mov        rax, rrConAddr
    sub        rax, ConPitch2
 
    movdqu    xxCmp, [rax+ 20]
    pmullw    xxCmp, xxfSPR2
 
    movdqu    xxTemp, [rax]
    psllw    xxTemp, lShiftCnt
    paddw    xxCmp, xxTemp
 
    movdqu    xxTemp, [rax- 20h]
    pmullw    xxTemp, xxsSPR2
    paddw    xxCmp, xxTemp
 
 
 
Inspect_Black2:
    movdqa        xxTemp, xxCmp                ; suppress (2*2*SPR ÇØÁØ suppress)
    psubusw    xxTemp, xxSupp
    psubusw    xxCmp, xxTemp
 
    movdqa        xxMinus2    , xxCmp
    psubusw    xxMinus2    , xxSrc
    movdqa        xxPlus2    , xxSrc
    psubusw    xxPlus2    , xxCmp
 
    mov            bx, 0
    movdqa        xxTemp, xxMinus2
    pcmpgtw    xxTemp, xxThres
    pand        xxPeak, xxTemp
    movdqa        xxTemp, xxMinus
    pmovmskb    rax, xxPeak
    cmp        rax, 0
    jne        DEFECT_00
 
Inspect_White2:
    mov            bx, 1
    movdqa        xxPeak, xxPlus2
    pcmpgtw    xxPeak, xxThres
    pand        xxPeak, xxPeak2
    movdqa        xxTemp, xxPlus
    pmovmskb    rax, xxPeak
    cmp        rax, 0
    je        Defect_None
 
 
 
DEFECT_00:
    pextrw    rax, xxPeak, 0
    cmp        rax, 0h
    je        Defect_01
    
    pextrw    rax, xxTemp, 0
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_01:
    inc        ix
    pextrw    rax, xxPeak, 1
    cmp        rax, 0h
    je        Defect_02
 
    pextrw    rax, xxTemp, 1
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_02:
    inc        ix
    pextrw    rax, xxPeak, 2
    cmp        rax, 0h
    je        Defect_03
    
    pextrw    rax, xxTemp, 2
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_03:
    inc        ix
    pextrw    rax, xxPeak, 3
    cmp        rax, 0h
    je        Defect_04
    
    pextrw    rax, xxTemp, 3
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_04:
    inc        ix
    pextrw    rax, xxPeak, 4
    cmp        rax, 0h
    je        Defect_05
    
    pextrw    rax, xxTemp, 4
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_05:
    inc        ix
    pextrw    rax, xxPeak, 5
    cmp        rax, 0h
    je        Defect_06
    
    pextrw    rax, xxTemp, 5
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_06:
    inc        ix
    pextrw    rax, xxPeak, 6
    cmp        rax, 0h
    je        Defect_07
    
    pextrw    rax, xxTemp, 6
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
DEFECT_07:
    inc        ix
    pextrw    rax, xxPeak, 7
    cmp        rax, 0h
    je        Defect_End
    
    pextrw    rax, xxTemp, 7
    sar        rax, 6
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    mov        [rrdp+ 2*rrNDefect], ax
    inc        rrNDefect
 
Defect_End:
    sub        ix, 7
    cmp        bx, 0
    je        Inspect_White2
 
Defect_None:
    mov        [rrdx+ 4*rrNDefect], ecx
    mov        [rrdy+ 4*rrNDefect], edx
    mov        [rrdt+ 2*rrNDefect], bx
    
    inc        iy    
    add        rrConAddr, 20h
    jmp        LOOP_Y
 
LOOP_Y_END:
    cmp        F_Y2Insp, 1
    je        LOOP_Y_END2
 
    add        ix, 8
    mov        rrConAddr, ConAddr
    add        rrConAddr, 10h
    mov        iy, InspTop
    mov        F_Y2Insp, 1
 
    jmp        LOOP_Y
 
LOOP_Y_END2:
 
    add        ix, 8h
    jmp        LOOP_X
LOOP_X_END:
 
 
 
 
END_BUFFER:
 
    mov        rax, rrNDefect                    ; return rrNDefect
    
    pop    rbx
    pop    rsi
    pop    rdi
    pop    r15
    pop    r14
    pop    r13
    pop    r12
    pop    r11
    pop    r10
    pop        rbp
 
RET
ConvVert2 ENDP
 
end