@@ -68,41 +68,7 @@ Tensor *Model::add(Tensor *input, Tensor *other, Tensor *output,
6868}
6969
7070const  OpConfigMap ArithmeticConfigMap = {
71-     {{OP_ARCH_ANY, " fp32"  },
72-      {
73-          //  NumWarps, SmemBytes, InDepsTiles, OutDepsTiles, SyncPre, SyncPost
74-          {8 , 0 , {{128 , 256 }, {128 , 256 }}, {{128 , 256 }}, false , false },
75-          {8 , 0 , {{256 , 128 }, {256 , 128 }}, {{256 , 128 }}, false , false },
76-          {8 , 0 , {{128 , 128 }, {128 , 128 }}, {{128 , 128 }}, false , false },
77-          {4 , 0 , {{64 , 64 }, {64 , 64 }}, {{64 , 64 }}, false , false },
78-          {2 , 0 , {{32 , 64 }, {32 , 64 }}, {{32 , 64 }}, false , false },
79-          {1 , 0 , {{16 , 64 }, {16 , 64 }}, {{16 , 64 }}, false , false },
80-          {1 , 0 , {{8 , 64 }, {8 , 64 }}, {{8 , 64 }}, false , false },
81-          {1 , 0 , {{2 , 128 }, {2 , 128 }}, {{2 , 128 }}, false , false },
82-          {1 , 0 , {{4 , 64 }, {4 , 64 }}, {{4 , 64 }}, false , false },
83-          {1 , 0 , {{2 , 64 }, {2 , 64 }}, {{2 , 64 }}, false , false },
84-          {1 , 0 , {{1 , 128 }, {1 , 128 }}, {{1 , 128 }}, false , false },
85-          {1 , 0 , {{1 , 64 }, {1 , 64 }}, {{1 , 64 }}, false , false },
86-          {1 , 0 , {{1 , 32 }, {1 , 32 }}, {{1 , 32 }}, false , false },
87-      }},
88-     {{OP_ARCH_ANY, " fp16"  },
89-      {
90-          //  NumWarps, SmemBytes, InDepsTiles, OutDepsTiles, SyncPre, SyncPost
91-          {8 , 0 , {{128 , 256 }, {128 , 256 }}, {{128 , 256 }}, false , false },
92-          {8 , 0 , {{256 , 128 }, {256 , 128 }}, {{256 , 128 }}, false , false },
93-          {8 , 0 , {{128 , 128 }, {128 , 128 }}, {{128 , 128 }}, false , false },
94-          {4 , 0 , {{64 , 64 }, {64 , 64 }}, {{64 , 64 }}, false , false },
95-          {2 , 0 , {{32 , 64 }, {32 , 64 }}, {{32 , 64 }}, false , false },
96-          {1 , 0 , {{16 , 64 }, {16 , 64 }}, {{16 , 64 }}, false , false },
97-          {1 , 0 , {{8 , 64 }, {8 , 64 }}, {{8 , 64 }}, false , false },
98-          {1 , 0 , {{2 , 128 }, {2 , 128 }}, {{2 , 128 }}, false , false },
99-          {1 , 0 , {{4 , 64 }, {4 , 64 }}, {{4 , 64 }}, false , false },
100-          {1 , 0 , {{2 , 64 }, {2 , 64 }}, {{2 , 64 }}, false , false },
101-          {1 , 0 , {{1 , 256 }, {1 , 256 }}, {{1 , 256 }}, false , false },
102-          {1 , 0 , {{1 , 128 }, {1 , 128 }}, {{1 , 128 }}, false , false },
103-          {1 , 0 , {{1 , 64 }, {1 , 64 }}, {{1 , 64 }}, false , false },
104-      }},
105-     {{OP_ARCH_ANY, " bf16"  },
71+     {{OP_ARCH_ANY, " any"  },
10672     {
10773         //  NumWarps, SmemBytes, InDepsTiles, OutDepsTiles, SyncPre, SyncPost
10874         {8 , 0 , {{128 , 256 }, {128 , 256 }}, {{128 , 256 }}, false , false },
0 commit comments